典型文献
基于端到端的蒙古语异形同音词声学建模方法
文献摘要:
蒙古语声学模型的训练过程是模型学习发音数据与标注数据之间关系的一个过程.针对以音素为建模粒子的蒙古语声学模型建模,由于蒙古语词的发音与语义存在一对多映射现象,会造成解码出的蒙古语文本错误,进而导致蒙古语语音识别系统识别率降低的问题.对此,该文以端到端模型为基础,以蒙古语音素、字母为蒙古语声学模型建模粒子,设计了基于BLSTM-CTC的蒙古语声学模型,并给出了动量训练算法.实验结果表明,基于蒙古语字母的BLSTM-CTC蒙古语声学模型可以有效降低蒙古语语音识别系统中异形同音词的词错率.
文献关键词:
异形同音词;建模粒子;端到端;蒙古语声学模型;语音识别
中图分类号:
作者姓名:
陈艳;李图雅;马志强;谢秀兰;王洪彬
作者机构:
内蒙古工业大学 数据科学与应用学院,内蒙古 呼和浩特 010080;内蒙古工业大学 内蒙古自治区基于大数据的软件服务工程技术研究中心,内蒙古 呼和浩特 010080
文献出处:
引用格式:
[1]陈艳;李图雅;马志强;谢秀兰;王洪彬-.基于端到端的蒙古语异形同音词声学建模方法)[J].中文信息学报,2022(03):27-35
A类:
异形同音词,蒙古语声学模型,建模粒子
B类:
声学建模,训练过程,模型学习,学习发音,音素,古语词,解码,蒙古语文,语语,语音识别系统,系统识别,识别率,端到端模型,字母,BLSTM,CTC,训练算法,词错率
AB值:
0.156835
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。