首站-论文投稿智能助手
典型文献
基于VOLT的藏汉双向机器翻译
文献摘要:
藏汉词表的生成不仅是藏汉双向机器翻译任务开始的第一步,而且影响着藏汉双向翻译效果.本文通过改进生成藏汉词表来提升下游藏汉双向翻译性能.一方面从词表拼接入手,采用高频使用正常词表,低频使用字节对编码词表的思想,通过反复训练找到最佳词频阈值;另一方面通过最优传输的词汇学习方法学习生成藏汉词表,并针对藏语本身语言特点进行改进后应用到藏汉双向翻译上.实验结果表明,本文针对藏文语言特点提出的字节对编码加最优传输的词汇学习方法效果最佳,在藏汉翻译任务上BLEU值达到37.35,汉藏翻译任务上BLEU值达到27.60.
文献关键词:
藏文词表;字节对编码;藏汉双向翻译;VOLT
作者姓名:
孙义栋;拥措;杨丹
作者机构:
西藏大学信息科学技术学院,西藏 拉萨 850000;西藏自治区藏文信息技术人工智能重点实验室,西藏 拉萨 850000;藏文信息技术教育部工程研究中心,西藏 拉萨 850000
文献出处:
引用格式:
[1]孙义栋;拥措;杨丹-.基于VOLT的藏汉双向机器翻译)[J].计算机与现代化,2022(05):28-32,39
A类:
VOLT,藏汉双向翻译,藏文词表
B类:
机器翻译,第一步,成藏,翻译性能,拼接,用字,字节对编码,复训,词频,最优传输,词汇学习方法,方法学,藏语,语言特点,BLEU,汉藏
AB值:
0.192863
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。