典型文献
基于拼音约束联合学习的汉语语音识别
文献摘要:
当前的语音识别模型在英语、法语等表音文字中已取得很好的效果.然而,汉语是一种典型的表意文字,汉字与语音没有直接的对应关系,但拼音作为汉字读音的标注符号,与汉字存在相互转换的内在联系.因此,在汉语语音识别中利用拼音作为解码时的约束,可以引入一种更接近语音的归纳偏置.该文基于多任务学习框架,提出一种基于拼音约束联合学习的汉语语音识别方法,以端到端的汉字语音识别为主任务,以拼音语音识别为辅助任务,通过共享编码器,同时利用汉字与拼音识别结果作为监督信号,增强编码器对汉语语音的表达能力.实验结果表明,相比基线模型,该文提出的方法取得了更优的识别效果,词错误率降低了 2.24%.
文献关键词:
端到端;汉语语音识别;联合学习;拼音
中图分类号:
作者姓名:
梁仁凤;余正涛;高盛祥;黄于欣;郭军军;许树理
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650500
文献出处:
引用格式:
[1]梁仁凤;余正涛;高盛祥;黄于欣;郭军军;许树理-.基于拼音约束联合学习的汉语语音识别)[J].中文信息学报,2022(10):167-172
A类:
汉语语音识别
B类:
拼音,联合学习,语音识别模型,法语,表音文字,表意文字,汉字读音,相互转换,解码,偏置,多任务学习,端到端,辅助任务,共享编码器,表达能力,比基,基线模型,错误率
AB值:
0.228701
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。