典型文献
跨信道环境下语种识别方法的研究
文献摘要:
针对现有语种识别方法对跨信道环境下关注较少的问题进行研究,在实际应用场景中语音采集设备与传输信道差异使得语种识别性能急剧下降.为降低跨信道对识别性能的影响,文中提出一种基于注意力机制的BiLSTM语种识别方法,在特征提取阶段对比MFCC、FBANK、LPCC等不同语音特征的识别效果.实验证明FBANK特征在跨信道环境下的识别效果更好,引入注意力机制能够关注跨信道语音片段中与语种相关的信息,忽略非语种信息.所提方法在东方语种识别竞赛两个跨信道数据集(AP19-OLR和AP20-OLR)上进行实验,通过与基线系统X-VECTOR等语种识别方法进行对比,得出所提方法在两个数据集上的等错误率(EER)降低3.48%和5.66%.实验结果表明,基于注意力机制的BiLSTM语种识别方法能够有效提高语种识别任务中的特征提取能力,并改善跨信道环境下的语种识别性能.
文献关键词:
语种识别;跨信道;特征提取;注意力机制;识别方法对比;BiLSTM模型
中图分类号:
作者姓名:
迪力扎提·伊力哈木;米吉提·阿不里米提;郑方;艾斯卡尔·艾木都拉
作者机构:
新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;清华大学 信息科学技术学院,北京 100084
文献出处:
引用格式:
[1]迪力扎提·伊力哈木;米吉提·阿不里米提;郑方;艾斯卡尔·艾木都拉-.跨信道环境下语种识别方法的研究)[J].现代电子技术,2022(24):37-43
A类:
FBANK,AP19,AP20,VECTOR
B类:
跨信道,语种识别,下关,传输信道,识别性,急剧下降,注意力机制,BiLSTM,MFCC,LPCC,语音特征,道数,OLR,等错误率,EER,特征提取能力,识别方法对比
AB值:
0.202849
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。