典型文献
基于残差网络和门控卷积网络的语音识别研究
文献摘要:
由于传统循环神经网络具有复杂的结构,需要大量的数据才能在连续语音识别中进行正确训练,并且训练需要耗费大量的时间,对硬件性能要求很大.针对以上问题,提出了基于残差网络和门控卷积神经网络的算法,并结合联结时序分类算法,构建端到端中文语音识别模型.该模型将语谱图作为输入,通过残差网络提取高层抽象特征,然后通过堆叠门控卷积神经网络捕获有效的长时间记忆,摆脱了传统循环神经网络对上下文相关性建模的依赖,加快了模型的训练速度.对残差网络进行了优化,并在门控卷积神经网络中加入了前馈神经网络,极大提高了模型的性能.实验结果表明,在Aishell-1中文数据集上,该模型的字错误率降低至11.43%;并且在?5 dB低信噪比环境下,字错误率达到了19.77%.
文献关键词:
残差网络;门控卷积神经网络;联结时序分类;Swish激活函数
中图分类号:
作者姓名:
朱学超;张飞;高鹭;任晓颖;郝斌
作者机构:
内蒙古科技大学 信息工程学院,内蒙古 包头 014000
文献出处:
引用格式:
[1]朱学超;张飞;高鹭;任晓颖;郝斌-.基于残差网络和门控卷积网络的语音识别研究)[J].计算机工程与应用,2022(07):185-191
A类:
联结时序分类,Aishell
B类:
残差网络,门控卷积网络,循环神经网络,连续语音,耗费,性能要求,门控卷积神经网络,分类算法,端到端,语音识别模型,语谱图,堆叠,时间记忆,上下文,训练速度,前馈神经网络,中文数据集,错误率,dB,低信噪比,Swish,激活函数
AB值:
0.273386
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。