基于语种关联度课程学习的多语言神经机器翻译|于东;谢婉莹;谷舒豪;冯洋|中国科学院计算技术研究所北京 100190 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于语种关联度课程学习的多语言神经机器翻译

文献摘要：

近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注.然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息.此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题.针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度.具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序.进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度.该方法填补了课程学习策略在多语言神经机器翻译领域的空白.文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64％.

文献关键词：

机器翻译;多语言;课程学习;关联度评估;语种排序;句子排序

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 语言、文字（H） / 常用外国语（H3） / 英语（H31） / 语文教学（H319）

[3] 语言、文字（H） / 语言学（H0） / 语言规划（H002）

作者姓名：

于东;谢婉莹;谷舒豪;冯洋

作者机构：

北京语言大学信息科学学院北京 100083;中国科学院计算技术研究所北京 100190;中国科学院大学北京 100049

文献出处：

计算机科学

引用格式：

[1]于东;谢婉莹;谷舒豪;冯洋-.基于语种关联度课程学习的多语言神经机器翻译)[J].计算机科学,2022(01):24-30

A类：

多语言神经机器翻译,Europarl,语种排序

B类：

课程学习,模型实现,多种语言,联和,模型训练,数据量,整体性能,收敛速度,具体来说,奇异向量,典型相关分析,余弦相似度,定语,言中,验证集,学习策略,系列课程,非平衡,IWSLT,语言数据,语料库,翻译系统,训练时间,关联度评估,句子排序

AB值：

0.235896

相似文献

基于变分信息瓶颈的半监督神经机器翻译

于志强;余正涛;黄于欣;郭军军;高盛祥-昆明理工大学信息工程与自动化学院昆明650500;云南民族大学数学与计算机科学学院昆明650500;云南省人工智能重点实验室昆明650500

基于预训练表示模型的英语词语简化方法

强继朋;钱镇宇;李云;袁运浩;朱毅-扬州大学信息工程学院扬州225127

TCS:一种用于跨语言文本标签预测的"老师-课程-学生"学习框架

浦通;黄书剑;张洋铭;周祥生;屠要峰;戴新宇;陈家骏-计算机软件新技术国家重点实验室南京大学南京 210023;鹏城实验室广东深圳 518054;中兴通讯股份有限公司南京 210012

命名实体识别方法研究综述

李冬梅;罗斯斯;张小平;许福-北京林业大学信息学院,北京 100083;国家林业和草原局林业智能信息处理工程技术研究中心,北京 100083;中国中医科学院中医药信息研究所,北京 100700

基于多语BERT的无监督攻击性言论检测

师夏阳;张风远;袁嘉琪;黄敏-郑州轻工业大学软件学院,郑州 450001;郑州轻工业大学数学与信息科学学院,郑州 450001

基于源语言句法增强解码的神经机器翻译方法

龚龙超;郭军军;余正涛-昆明理工大学信息工程与自动化学院,昆明 650504;云南省人工智能重点实验室(昆明理工大学),昆明 650504

融合双向依存自注意力机制的神经机器翻译

李治瑾;赖华;文永华;高盛祥-昆明理工大学信息工程与自动化学院,昆明 650504;云南省人工智能重点实验室(昆明理工大学),昆明 650504

自然语言语法纠错的最新进展和挑战

张明;卢庆华;黄元忠;李瑞轩-华中科技大学计算机科学与技术学院,武汉 430074;深圳市方直科技股份有限公司木愚部,广东深圳 518000

数据增广策略在英语语法纠错中的应用综述

孙晓东;杨东强-山东建筑大学计算机科学与技术学院,济南 250101

基于注意力迁移的跨语言关系抽取方法

吴婧;杨百龙;田罗庚-火箭军工程大学信息与通信工程系,西安710000;国防科技大学信息通信学院,西安710000

使用词对齐半监督对抗学习的汉越跨语言摘要生成方法

王剑;张莹;余正涛;黄于欣-昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500

一种服饰风格特征指导下的服装搭配学习模型

刘锐;彭敦陆-上海理工大学光电信息与计算机工程学院,上海200093

融入语言差异化特征的汉越神经机器翻译译文质量估计

邹翔;朱俊国;高盛祥;余正涛;杨福岸-昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500

一种通过评价类别分类提升评价对象抽取性能的方法

崔伟琪;严馨;滕磊;陈玮;徐广义-昆明理工大学信息工程与自动化学院,昆明 650504;昆明理工大学云南省人工智能重点实验室,昆明 650504;湖南快乐阳光互动娱乐传媒有限公司,长沙 410000;云南南天电子信息产业股份有限公司,昆明 650040

基于VOLT的藏汉双向机器翻译

孙义栋;拥措;杨丹-西藏大学信息科学技术学院,西藏拉萨 850000;西藏自治区藏文信息技术人工智能重点实验室,西藏拉萨 850000;藏文信息技术教育部工程研究中心,西藏拉萨 850000

基于课程学习的深度强化学习研究综述

林泽阳;赖俊;陈希亮-陆军工程大学指挥控制工程学院,江苏南京 210007

基于孪生网络和BERT模型的主观题自动评分系统

钱升华-北京师范大学人工智能学院, 北京 100875;天津财经大学珠江学院数据工程学院, 天津 301811

基于GAN模型优化的神经机器翻译

熊伟;高娟娟;刘锴-华北电力大学保定计算机系,保定071003;华北电力大学保定复杂能源系统智能计算工程研究中心,保定071003

面向神经机器翻译的枢轴方法研究综述

黎家全;王丽清;李鹏;蒋晓敏;徐永跃-云南大学信息学院,昆明 650091;云南广播电视台,昆明 650500

结合gazetteers和句法依存树的中文命名实体识别

方红;苏铭;冯一铂;张澜-上海第二工业大学文理学部,上海 201209;上海第二工业大学工学部,上海 201209;喀什大学数学与统计学院,新疆喀什 844000

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。