首站-论文投稿智能助手
典型文献
基于中文语义?音韵信息的语音识别文本校对模型
文献摘要:
为了研究拼音对检测和纠正语音识别文本错误的影响,提出了一种基于中文语义?音韵信息的文本校对模型.定义了5种拼音编码方法构建字符?音韵嵌入向量,以此作为基于GRU的Seq2Seq模型的输入,并应用注意力机制提取语句的语义?音韵信息来校对语音识别文本错误.针对标注语料不足的问题,提出了一种基于拼音声韵置换的数据增强方法.在AISHELL-3公开数据集的实验结果表明,拼音携带的音韵信息有利于校对语音识别文本错误,所提方法可提升模型的检错性能.
文献关键词:
文本校对;语音识别;拼音;注意力机制
作者姓名:
仲美玉;吴培良;窦燕;刘毅;孔令富
作者机构:
燕山大学信息科学与工程学院,河北秦皇岛 066004;河北省计算机虚拟技术与系统集成重点实验室,河北秦皇岛 066004;河北省软件工程重点实验室,河北秦皇岛 066004
文献出处:
引用格式:
[1]仲美玉;吴培良;窦燕;刘毅;孔令富-.基于中文语义?音韵信息的语音识别文本校对模型)[J].通信学报,2022(11):65-79
A类:
B类:
音韵,语音识别,文本校对,拼音,编码方法,字符,嵌入向量,GRU,Seq2Seq,注意力机制,语句,来校,语料,音声,声韵,数据增强,增强方法,AISHELL,公开数据集,检错
AB值:
0.367865
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。