首站-论文投稿智能助手
典型文献
IMUT-MC:一个针对蒙古语语音识别的语音语料库
文献摘要:
蒙古语作为少数民族语言,其使用人群分布辽阔,收集标注语音数据困难,导致没有公开的大规模蒙古语语音语料库为广大研究人员提供实验支撑,阻碍了蒙古语语音识别的进一步发展.本课题组构建了一个针对蒙古语语音识别任务的语音语料库IMUT-MC,包含417位说话人录制的约212小时的阅读语音,致力于推进蒙古语语音识别研究.课题组分别在传统语音识别模型和端到端语音识别模型上使用IMUT-MC进行基线语音识别实验,基于GMM-HMM、DNN-HMM和Transformer的语音识别模型在IMUT-MC上词错率分别为69.90%、67.45%和26.10%,证明了IMUT-MC是进行蒙古语语音识别可靠的语料库.
文献关键词:
蒙古语;语音识别;语音语料库;阅读语音
作者姓名:
刘志强;马志强;张晓旭;宝财吉拉呼;谢秀兰;朱方圆
作者机构:
内蒙古工业大学数据科学与应用学院,呼和浩特 010000;内蒙古自治区基于大数据的软件服务工程技术研究中心,呼和浩特 010000
引用格式:
[1]刘志强;马志强;张晓旭;宝财吉拉呼;谢秀兰;朱方圆-.IMUT-MC:一个针对蒙古语语音识别的语音语料库)[J].中国科学数据(中英文网络版),2022(02):71-83
A类:
IMUT,阅读语音
B类:
MC,蒙古语,语语,语音语料库,少数民族语言,使用人群,人群分布,辽阔,语音数据,大研,组构,说话,录制,语音识别模型,端到端语音识别,GMM,HMM,DNN,Transformer,词错率
AB值:
0.192967
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。