典型文献
面向低资源俄汉机器翻译的领域适应方法
文献摘要:
基于Transformer的神经机器翻译在高资源语言对上取得了巨大的成功,但是在资源稀缺的情况下模型翻译效果较差.针对旅游口语领域的俄汉低资源机器翻译,本文通过扩充领域内数据和多种微调方法改善目标领域翻译质量.首先利用多种语料过滤方法得到通用领域俄汉语料,然后在不同参数配置的Transformer模型上进行预训练,探索多种领域适应性微调方法,得到最优模型,最后在译码阶段采用模型平均和后处理生成翻译结果.实验结果表明,该方法可以有效提升低资源场景下的俄汉机器翻译效果.
文献关键词:
神经机器翻译;低资源语言;领域适应;mRASP
中图分类号:
作者姓名:
刘欢;刘俊鹏;黄锴宇;黄德根
作者机构:
大连理工大学计算机科学与技术学院,辽宁 大连 116024
文献出处:
引用格式:
[1]刘欢;刘俊鹏;黄锴宇;黄德根-.面向低资源俄汉机器翻译的领域适应方法)[J].厦门大学学报(自然科学版),2022(04):654-659
A类:
mRASP
B类:
领域适应,Transformer,神经机器翻译,资源稀缺,口语,低资源机器翻译,微调,翻译质量,语料,过滤方法,俄汉语,同参数,参数配置,预训练,最优模型,译码,模型平均,低资源语言
AB值:
0.34109
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。