典型文献
MFCCs和DTW在拼音相似度中的研究
文献摘要:
汉语拼音的模糊匹配在关键词匹配、语音纠错等场景占据着重要地位,而传统的模糊匹配方法无法计算不同声母、韵母之间的听觉相似度,只能简单地将其作为相同和不同的两种情形处理,这在实际使用中,容易受方言、发音习惯等因素影响匹配正确率.文章针对该问题,提出了一种基于梅尔频率倒谱系数(MFCCs)和加入惩罚系数的动态时间序列规整(DTW)的方法,计算汉语拼音中各部分的相似度.MFCCs能够提取声音频谱中符合人耳听觉特性的特征,而DTW方法能够计算时间序列的相似度.根据实验表明,该方法能较好地区分出汉语拼音中发音相似的音标,能够提高各种拼音模糊匹配场景的匹配性能和准确率.
文献关键词:
拼音模糊匹配;拼音相似度;梅尔频率倒谱系数;动态时间序列规整
中图分类号:
作者姓名:
徐扬;张嘉宝;杨满玉;李晶;聂云丽
作者机构:
长江大学地球物理与石油资源学院,湖北武汉430100
文献出处:
引用格式:
[1]徐扬;张嘉宝;杨满玉;李晶;聂云丽-.MFCCs和DTW在拼音相似度中的研究)[J].电脑知识与技术,2022(14):1-4,8
A类:
拼音相似度,动态时间序列规整,拼音模糊匹配
B类:
MFCCs,DTW,汉语拼音,配在,纠错,匹配方法,同声,声母,韵母,方言,发音,梅尔频率倒谱系数,罚系数,音频,人耳听觉,计算时间,分出,音标,匹配性能
AB值:
0.246034
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。