FAILED
首站-论文投稿智能助手
典型文献
基于数据挖掘的机器英语翻译模型研究
文献摘要:
为提升机器英语翻译的有效性、翻译精度以及机器翻译模型的邻域自适应能力,该文研究了基于数据挖掘的机器英语翻译模型.利用LDA模型挖掘平行语料内文本中的主题信息,利用词表上的多项式分布表示主题,判断文档集合内各文档主题所占比例,依据概率抽样主题相应词表的多项式分布获取具体单词,利用极大似然估计方法处理目标语言单语语料,并将平行语料作为训练目标,通过重要性采样以及全概率公式估计目标语言单语语料,建立机器英语翻译模型,选取束搜索方法采样获取估算期望值,实现英语语句翻译.模型测试结果表明,采用该模型翻译不同语料库内语句的语义信息的召回率高于96%,GLEU值高于58,邻域自适应能力较强.
文献关键词:
数据挖掘;机器英语;翻译模型;LDA模型;平行语料
作者姓名:
王雪;王娟;胡仁青
作者机构:
西安交通工程学院,陕西西安710300
文献出处:
引用格式:
[1]王雪;王娟;胡仁青-.基于数据挖掘的机器英语翻译模型研究)[J].电子设计工程,2022(15):167-171
A类:
机器英语,GLEU
B类:
英语翻译,翻译模型,提升机,机器翻译,邻域,域自适应,自适应能力,LDA,平行语料,内文,用词,词表,多项式,文档,概率抽样,单词,极大似然估计,估计方法,目标语言,单语,语语,重要性采样,全概率公式,估计目标,搜索方法,期望值,语句翻译,模型测试,语料库,库内,语义信息,召回率
AB值:
0.310775
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。