典型文献
基于CNN-CTC的蒙古语层迁移语音识别模型
文献摘要:
针对蒙古语语音识别模型训练时语料资源匮乏,导致的低资源语料无法满足深度网络模型充分训练的问题.该文基于迁移学习提出了层迁移方法,针对层迁移设计了多种迁移策略构建基于CNN-CTC(卷积神经网络和连接时序分类器)的蒙古语层迁移语音识别模型,并对不同的迁移策略进行探究,从而得到最优模型.在10000句英语语料数据集和5000句蒙古语语料数据集上开展了层迁移模型训练中学习率选择实验、层迁移有效性实验、迁移层选择策略实验以及高资源模型训练数据量对层迁移模型的影响实验.实验结果表明,层迁移模型可以加快训练速度,且可以有效降低模型的WER;采用自下向上的迁移层选择策略可以获得最佳的层迁移模型;在有限的蒙古语语料资源下,基于CNN-CTC的蒙古语层迁移语音识别模型比普通基于CNN-CTC的蒙古语语音识别模型的WER降低10.18%.
文献关键词:
语音识别;低语料资源;层迁移
中图分类号:
作者姓名:
吕浩田;马志强;王洪彬;谢秀兰
作者机构:
内蒙古工业大学 数据科学与应用学院,内蒙古 呼和浩特010080;内蒙古自治区基于大数据的软件服务工程技术研究中心,内蒙古 呼和浩特010080
文献出处:
引用格式:
[1]吕浩田;马志强;王洪彬;谢秀兰-.基于CNN-CTC的蒙古语层迁移语音识别模型)[J].中文信息学报,2022(06):52-60
A类:
低语料资源
B类:
CTC,蒙古语,层迁移,语音识别模型,语语,模型训练,低资源,源语,深度网络模型,迁移学习,迁移策略,策略构建,连接时序分类,分类器,最优模型,迁移模型,学习率,选择实验,选择策略,资源模型,训练数据,数据量,训练速度,WER,获得最佳
AB值:
0.224223
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。