FAILED
首站-论文投稿智能助手
典型文献
用于大词汇量语音识别的门控残差DFSMN声波模型
文献摘要:
深度前馈序列记忆网络(DFSMN,Deep Feedforward Sequential Memory Network)是一种识别精度较高的声学模型,其在相邻的记忆块间引入跳跃链接来缓解梯度消失问题.而训练一个深层堆叠的DFSMN仍是十分具有挑战性的任务,且简单的网络层堆叠并不能使网络模型的性能得到提升.在构造非常深的神经网络结构时,残差学习是一种有效的方法,可以帮助神经网络更容易、更快地收敛.提出一种名为门控残差DFSMN(Gated Residual DFSMN,GR-DFSMN)的新型网络结构.该模型从低层DFSMN块引入了额外的门控捷径用于有效地训练深层DFSMN结构的网络.实验结果表明,当训练非常深的模型时,GR-DFSMN相比于普通的DFSMN具有较好的性能.在1000小时的大规模英语语料库Librispeech中,当层数达到40时,与DFSMN相比,GR-DFSMN在四个测试集上评估所得的平均字错误率降低了0.7%.
文献关键词:
语音识别;DFSMN;门控残差;CTC
作者姓名:
霍伟明;徐浩
作者机构:
广东美的制冷设备有限公司 广东佛山 528311
文献出处:
引用格式:
[1]霍伟明;徐浩-.用于大词汇量语音识别的门控残差DFSMN声波模型)[J].家电科技,2022(05):22-25
A类:
DFSMN,Librispeech
B类:
词汇量,语音识别,门控残差,波模,前馈,列记,记忆网络,Deep,Feedforward,Sequential,Memory,Network,识别精度,声学模型,跳跃链,接来,梯度消失,堆叠,网络层,神经网络结构,残差学习,Gated,Residual,GR,低层,捷径,语语,语料库,层数,测试集,评估所,错误率,CTC
AB值:
0.360717
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。