首站-论文投稿智能助手
典型文献
维汉人名翻译中不雅字或OOV的前处理研究
文献摘要:
针对维汉人名数据集稀少且难以获取等问题,提出了从常规维汉句对数据中通过Fast align对齐方法结合NER方法抽取维汉人名数据的方法.针对维吾尔人名翻译后易出现集外词(OOV)问题或不雅字、不恰当译文表示的问题,通过对维汉人名数据中汉语部分训练1—4阶N-Gram语言模型,根据语言模型对该数据进行打分后筛选出best-2结果,并结合了维汉字符级端到端的神经网络人名翻译模型.通过实验可发现,结合本文提出的前处理方法后的维汉人名翻译模型效果是BLEU提升了0.95分,并且不雅字或不恰当表示问题也得到了明显的改善.
文献关键词:
机器翻译;OOV;维汉人名;Fast align;字符级端到端的神经网络
作者姓名:
阿里木·赛买提;沙丽瓦尔·阿里木;吐尔根·依不拉音;段雪明;古丽尼格尔·阿不都外力;麦合甫热提;吾守尔·斯拉木
作者机构:
新疆大学信息科学与工程学院多语种信息技术实验中心,新疆乌鲁木齐830046;新疆开放大学,新疆乌鲁木齐830049;新疆科大讯飞信息科技有限责任公司,新疆乌鲁木齐830015
引用格式:
[1]阿里木·赛买提;沙丽瓦尔·阿里木;吐尔根·依不拉音;段雪明;古丽尼格尔·阿不都外力;麦合甫热提;吾守尔·斯拉木-.维汉人名翻译中不雅字或OOV的前处理研究)[J].东北师大学报(自然科学版),2022(02):76-80
A类:
维汉人名,字符级端到端的神经网络
B类:
人名翻译,不雅,OOV,名数,稀少,Fast,align,对齐方法,NER,维吾尔,译文,Gram,语言模型,打分,best,汉字,网络人,翻译模型,前处理方法,BLEU,机器翻译
AB值:
0.237367
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。