FAILED
首站-论文投稿智能助手
典型文献
面向铁路旅客服务应用的语音识别模型研究
文献摘要:
为扩大面向铁路旅客服务的语音识别应用,文章研究适用于铁路旅客服务应用的语音识别模型,使用基于卷积增强的Conformer编码结构和RNN-T模型结构,构建基于Conformer-Transducer的语音识别模型.由于卷积网络容易忽视输入信号整体与局部间关联,在Conformer结构中的卷积模块加入注意力机制,用以修正卷积模块的计算结果.构建铁路旅客服务语音数据集,对改进的语音识别模型进行测评;结果表明:改进后的语音识别模型准确率达到92.09%,相较于一般的Conformer-Transducer模型,语音识别字错误率降低0.33%.鉴于铁路旅客服务涉及铁路出行条例、旅客常问问题等众多文本信息,在语音识别模型中融入语言模型与热词赋权2种文本处理机制,使其在铁路专有名词的识别上优于通用的语音识别算法;文章研究提出的语音识别模型已应用于旅客常问问题查询设备和车站智能服务机器人,有助于提高铁路旅客服务水平,改善铁路旅客出行体验,促进铁路旅客服务工作实现减员增效.
文献关键词:
铁路旅客服务;语音识别模型;机器学习;神经网络;语言模型;热词赋权
作者姓名:
王心雨;景辉
作者机构:
中国铁道科学研究院 研究生部,北京 100081;中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081
引用格式:
[1]王心雨;景辉-.面向铁路旅客服务应用的语音识别模型研究)[J].铁路计算机应用,2022(04):7-15
A类:
铁路旅客服务,热词赋权,铁路专有名词
B类:
服务应用,语音识别模型,卷积增强,Conformer,编码结构,RNN,模型结构,Transducer,卷积网络,整体与局部,卷积模块,注意力机制,语音数据,模型准确率,识别字,错误率,问问题,众多文,多文本,文本信息,语言模型,文本处理,处理机制,语音识别算法,车站,智能服务,服务机器人,提高铁路,旅客出行,出行体验,服务工作,减员增效
AB值:
0.203555
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。