典型文献
基于联合端点检测和动态范围控制的语种识别
文献摘要:
在语种识别系统中,静音段干扰、话音分贝范围不一致均会导致语种识别性能下降.此外,利用语谱图进行语种识别的算法由于无法有效展现其低频部分的信息,也会导致语种识别性能无法提升.为此,提出了一种基于联合端点检测和动态范围控制的语种识别方法.首先提取语音梅尔倒谱系数的第一维系数,随后使用中值滤波对特征参数进行平滑处理并进行端点检测以去除语音中静音段干扰,其次使用动态范围控制来调整不同语音的分贝值范围,最后将log刻度语谱图输入到卷积神经网络中进行分类.实验结果表明,在ResNeSt网络中,在VoxForge公共语料库下,所提算法相比传统的基于语谱图的语种识别算法性能提升了 7.16个百分点.此外,在相同实验设置下,log刻度语谱图的识别性能也优于其他主流特征,充分验证了所提算法和特征的有效性与优越性.
文献关键词:
傅里叶光学与信号处理;语种识别;端点检测;动态范围控制;语谱图;卷积神经网络
中图分类号:
作者姓名:
王延凯;龙华;邵玉斌;杜庆治;王瑶
作者机构:
昆明理工大学信息工程与自动化学院,云南昆明650500
文献出处:
引用格式:
[1]王延凯;龙华;邵玉斌;杜庆治;王瑶-.基于联合端点检测和动态范围控制的语种识别)[J].激光与光电子学进展,2022(13):195-202
A类:
动态范围控制,VoxForge,傅里叶光学与信号处理
B类:
端点检测,语种识别,识别系统,静音,音段,话音,音分,分贝,致语,识别性,性能下降,语谱图,梅尔倒谱系数,中值滤波,平滑处理,log,刻度,ResNeSt,共语,语料库,识别算法,算法性能,性能提升,百分点,实验设置
AB值:
0.218563
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。