典型文献
神经网络词切分在蒙汉机器翻译中的应用
文献摘要:
蒙古文词切分是蒙古文信息处理的主要任务,词切分的准确性和合理性不仅可以缓解数据稀疏问题,且会直接影响蒙古文信息处理的后续工作.针对蒙古文的黏着性以及词语形态变化丰富的特点,首先,给出基于神经网络的蒙古文词切分预处理方法,实验结果表明,神经网络词切分方法准确率达到97.37%;其次,构建了基于蒙古文词切分的Transformer蒙汉神经机器翻译模型;最后,对比了不同蒙古文词切分方法在Transformer蒙汉机器翻译中的效果.研究结果表明,根据蒙古文语法规则把蒙古文连接元音字母和不稳定"N"当作停用词进行过滤的BiLSTM-CNN-CRF神经网络的词切分方法在机器翻译译文中的BLEU值可达73.30%,提高了机器翻译质量.
文献关键词:
词切分;神经网络;蒙汉机器翻译
中图分类号:
作者姓名:
何乌云;王斯日古楞
作者机构:
内蒙古师范大学 计算机科学技术学院,内蒙古 呼和浩特011500
文献出处:
引用格式:
[1]何乌云;王斯日古楞-.神经网络词切分在蒙汉机器翻译中的应用)[J].中央民族大学学报(自然科学版),2022(04):36-46
A类:
B类:
词切分,蒙汉机器翻译,蒙古文,文词,信息处理,主要任务,解数,数据稀疏,后续工作,黏着性,词语,语形,形态变化,预处理方法,Transformer,蒙汉神经机器翻译,神经机器翻译模型,语法规则,元音,字母,停用,用词,行过滤,BiLSTM,CRF,译文,BLEU,翻译质量
AB值:
0.264774
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。