首站-论文投稿智能助手
典型文献
编码器-解码器模型合成汉英语码转换文本
文献摘要:
为了解决汉英语码转换文本数据稀缺的问题,本文提出了基于编码器-解码器模型合成语码转换文本的方法,从有限的语码转换文本与大量单语种平行语料中学习语码转换语言学规则与语种内部的语言学规则,来合成语码转换文本.但是该模型合成的语码转换文本自然度低,因此本文又提出基于带复制机制的编码器-解码器模型合成语码转换文本的方法,在编码器-解码器的基础上,增加了一个门控,用来决定从编码器的预测结果还是从编码器的输入源文本中产生下一个词.最终,该方法使语言模型在SEAME测试集上的困惑度降低了绝对13.96.由此可得出结论,本文提出的方法可大规模地合成自然度高的语码转换文本,缓解语码转换文本数据的稀缺性.
文献关键词:
语码转换;编码器-解码器;合成文本;语言模型;语音识别
作者姓名:
黄哲莹;刘作桢;徐及;赵庆卫
作者机构:
中国科学院大学,北京100049;中国科学院声学研究所语音与智能信息处理实验室,北京100190
文献出处:
引用格式:
[1]黄哲莹;刘作桢;徐及;赵庆卫-.编码器-解码器模型合成汉英语码转换文本)[J].信号处理,2022(10):2074-2081
A类:
SEAME,合成文本
B类:
编码器,解码器,成汉,汉英语码转换,换文,文本数据,成语,单语,语种,平行语料,习语,种内,自然度,复制机制,在编,门控,生下,语言模型,测试集,解语,稀缺性,语音识别
AB值:
0.163461
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。