首站-论文投稿智能助手
典型文献
复杂环境下基于自适应深度神经网络的鲁棒语音识别
文献摘要:
在连续语音识别系统中,针对复杂环境(包括说话人及环境噪声的多变性)造成训练数据与测试数据不匹配导致语音识别率低下的问题,提出一种基于自适应深度神经网络的语音识别算法.结合改进正则化自适应准则及特征空间的自适应深度神经网络提高数据匹配度;采用融合说话人身份向量i-vector及噪声感知训练克服说话人及环境噪声变化导致的问题,并改进传统深度神经网络输出层的分类函数,以保证类内紧凑、类间分离的特性.通过在TIMIT英文语音数据集和微软中文语音数据集上叠加多种背景噪声进行测试,实验结果表明,相较于目前流行的GMM-HMM和传统DNN语音声学模型,所提算法的识别词错误率分别下降了5.151%和3.113%,在一定程度上提升了模型的泛化性能和鲁棒性.
文献关键词:
语音识别;深度神经网络;改进自适应准则;特征空间
作者姓名:
张开生;赵小芬
作者机构:
陕西科技大学电气与控制工程学院,陕西 西安 710021
引用格式:
[1]张开生;赵小芬-.复杂环境下基于自适应深度神经网络的鲁棒语音识别)[J].计算机工程与科学,2022(06):1105-1113
A类:
鲁棒语音识别,改进自适应准则
B类:
复杂环境,深度神经网络,连续语音,语音识别系统,说话,环境噪声,多变性,训练数据,测试数据,致语,识别率,语音识别算法,正则化,特征空间,数据匹配,匹配度,vector,感知训练,出层,分类函数,紧凑,TIMIT,语音数据,微软,背景噪声,GMM,HMM,DNN,音声,声学模型,错误率,别下,泛化性能
AB值:
0.414422
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。