首站-论文投稿智能助手
典型文献
低频词表示增强的低资源神经机器翻译
文献摘要:
在神经机器翻译过程中,低频词是影响翻译模型性能的一个关键因素.由于低频词在数据集中出现次数较少,训练经常难以获得准确的低频词表示,该问题在低资源翻译中的影响更为突出.该文提出了一种低频词表示增强的低资源神经机器翻译方法.该方法的核心思想是利用单语数据上下文信息来学习低频词的概率分布,并根据该分布重新计算低频词的词嵌入,然后在所得词嵌入的基础上重新训练Transformer模型,从而有效缓解低频词表示不准确问题.该文分别在汉越和汉蒙两个语言对四个方向上分别进行实验,实验结果表明,该文提出的方法相对于基线模型均有显著的性能提升.
文献关键词:
低频词表示;信息增强;低资源;神经机器翻译
作者姓名:
朱俊国;杨福岸;余正涛;邹翔;张泽锋
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明650500;昆明理工大学 云南省人工智能重点实验室,云南 昆明650500
文献出处:
引用格式:
[1]朱俊国;杨福岸;余正涛;邹翔;张泽锋-.低频词表示增强的低资源神经机器翻译)[J].中文信息学报,2022(06):44-51
A类:
低频词表示,低资源神经机器翻译,低资源翻译
B类:
翻译过程,翻译模型,模型性能,难以获得,翻译方法,核心思想,单语,上下文信息,概率分布,词嵌入,新训,Transformer,基线模型,性能提升,信息增强
AB值:
0.168647
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。