首站-论文投稿智能助手
典型文献
DNN模型对汉语电话录音识别的研究与比较
文献摘要:
深度神经网络DNN(Deep Neural Network)是近年机器学习理论中被诸多研究者广泛关注的语音识别模型.DNN模型利用DNN的学习能力可提升对噪声和口音的鲁棒性,在很多大规模语音识别任务中都超过了GMM模型.本文基于DNN与HMM特点,提取40维的MFCC特征向量后,利用DNN的每个输出节点估计HMM每个状态的后验概率,进而得到了对电话录音场景下的模型参数.最后,对1000小时的汉语电话录音和公开汉语语料集thchs-30上进行三次模型训练设计实验,并对比GMM-HMM模型参数效果.实验结果表明,DNN-HMM模型在1000小时的电话录音测试集上误识率降低了5.84%-9.42%,且两种模型识别效果表现得都比较稳定.
文献关键词:
DNN;GMM;电话录音;Kaldi
作者姓名:
孔玲军;李艳
作者机构:
南开大学滨海学院 天津 300270
文献出处:
引用格式:
[1]孔玲军;李艳-.DNN模型对汉语电话录音识别的研究与比较)[J].福建电脑,2022(03):52-54
A类:
汉语电话录音,电话录音,录音场,录音场景,thchs
B类:
DNN,深度神经网络,Deep,Neural,Network,机器学习理论,语音识别模型,口音,GMM,HMM,MFCC,特征向量,点估计,后验概率,语语,语料,模型训练,训练设计,设计实验,测试集,误识,模型识别,比较稳定,Kaldi
AB值:
0.291719
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。