典型文献
TDNN模型对电话录音场景的识别研究
文献摘要:
近几年,延时神经网络TDNN模型在语音识别领域取得了非常好的效果.由于其具有权值共享和子采样等特点,使其减少了参数的训练规模.本文将3000小时汉语电话录音语料通过TDNN模型训练声学参数.在3000小时内的随机测试集上,TDNN的误识率比DNN降低了0.62%至1.18%.但是,在3000小时外的测试集上,DNN与TDNN的效果各有优劣,但都表现得较为稳定.
文献关键词:
DNN;TDNN;汉语电话录音;Kaldi;子采样
中图分类号:
作者姓名:
孔玲军
作者机构:
南开大学滨海学院 天津 300270
文献出处:
引用格式:
[1]孔玲军-.TDNN模型对电话录音场景的识别研究)[J].福建电脑,2022(04):50-52
A类:
TDNN,电话录音,录音场,录音场景,汉语电话录音
B类:
延时,语音识别,权值共享,子采样,语料,模型训练,声学参数,随机测试,测试集,误识,Kaldi
AB值:
0.212191
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。