基于多粒度特征的文本生成评价方法|赖华;高玉梦;黄于欣;余正涛;张勇丙|昆明理工大学云南省人工智能重点实验室,云南昆明 650504 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于多粒度特征的文本生成评价方法

文献摘要：

近年来,基于预训练语言模型的文本生成评价方法得到了广泛关注,其通过计算两个句子间子词粒度的相似度来评价生成文本的质量.但是对于越南语、泰语等存在大量黏着语素的语言,单个音节或子词不能独立成词表达语义,仅基于子词粒度匹配的方法并不能够完整表征两个句子间的语义相似关系.基于此,该文提出一种基于子词、音节、词组等多粒度特征的文本生成评价方法.首先基于MBERT模型生成文本的表示,然后引入音节、词组等粗粒度语义单元之间的相似性来增强子词粒度的相似度评价模型.在机器翻译、跨语言摘要、跨语言数据筛选等任务上的实验结果表明,该文提出的多粒度特征评价方法相比ROUGE、BLEU等基于统计的评价方法以及Bertscore等基于语义相似度的评价方法都取得了更好的性能,与人工评价结果相关性更高.

文献关键词：

文本生成;评价方法;黏着语素;多粒度特征;MBERT

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

赖华;高玉梦;黄于欣;余正涛;张勇丙

作者机构：

昆明理工大学信息工程与自动化学院,云南昆明 650504;昆明理工大学云南省人工智能重点实验室,云南昆明 650504

文献出处：

中文信息学报

引用格式：

[1]赖华;高玉梦;黄于欣;余正涛;张勇丙-.基于多粒度特征的文本生成评价方法)[J].中文信息学报,2022(03):45-53,63

A类：

黏着语素,MBERT,Bertscore

B类：

多粒度特征,文本生成,预训练语言模型,句子,子词,成文,越南语,泰语,音节,立成,成词,词表,相似关系,词组,模型生成,粗粒度,增强子,相似度评价,机器翻译,跨语言摘要,跨语言数据,数据筛选,特征评价,ROUGE,BLEU,语义相似度

AB值：

0.277733

相似文献

基于语义一致性的细节保持图像生成方法

崔怀磊;刘丽;张化祥;刘冬梅;马跃;王泽康-山东师范大学信息科学与工程学院济南 250399;山东交通学院信息科学与电气工程学院济南 250300

基于语句融合和自监督训练的文本摘要生成模型

邹傲;郝文宁;靳大尉;陈刚-陆军工程大学指挥控制工程学院南京210007

基于MFFMB的电商评论文本分类研究

谢星雨;余本功-合肥工业大学管理学院合肥 230009;过程优化与智能决策教育部重点实验室合肥 230009

MWEC:一种基于多语义词向量的中文新词发现方法

张乐;冷基栋;吕学强;袁梦龙;游新冬-北京信息科技大学网络文化与数字传播北京市重点实验室北京 100101

基于改进图卷积神经网络的评论有用性识别

李雪梅;蒋建洪-桂林电子科技大学商学院桂林541004

基于URL多粒度特征融合的钓鱼网站识别

胡忠义;张硕果;吴江-武汉大学信息管理学院武汉430072;武汉大学电子商务研究与发展中心武汉430072

融合自注意力机制的长文本生成对抗网络模型

夏鸿斌;肖奕飞;刘渊-江南大学人工智能与计算机学院,江苏无锡 214122;江苏省媒体设计与软件技术重点实验室,江苏无锡 214122

基于图卷积网络的文本分割模型

杜雨奇;郑津;王杨;黄诚;李平-西南石油大学计算机科学学院,成都 610500

支持背景知识的多维端到端短语识别算法研究

刘广;涂刚;李政;刘译键;占志强-华中科技大学计算机科学与技术学院,武汉 430074

基于注意力迁移的跨语言关系抽取方法

吴婧;杨百龙;田罗庚-火箭军工程大学信息与通信工程系,西安710000;国防科技大学信息通信学院,西安710000

基于Bi-LSTM的期货市场关联交易行为检测方法

张源;康乐;宫朝辉;张志鸿-郑州大学信息工程学院郑州450001;清华大学计算机科学与技术系北京100084;郑州易盛信息金融创新实验室郑州450018

基于粒度感知和语义聚合的图像-文本检索网络

缪岚芯;雷雨;曾鹏鹏;李晓瑜;宋井宽-电子科技大学计算机科学与工程学院(网络空间安全学院) 成都 611731;电子科技大学信息与软件工程学院成都 610054

一种基于多粒度特征的软件多样性评估方法

迟宇宁;郭云飞;王亚文;扈红超-解放军战略支援部队信息工程大学信息技术研究所郑州450001

使用词对齐半监督对抗学习的汉越跨语言摘要生成方法

王剑;张莹;余正涛;黄于欣-昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学云南省人工智能重点实验室,昆明650500

基于聚合多阶邻域信息的细化方法的多粒度网络表示学习

赵姝;刘梦婷;杜紫维;宋文超;韩光洁-计算智能与信号处理教育部重点实验室,合肥230601;安徽大学计算机科学与技术学院,合肥230601;安徽省信息材料与智能传感重点实验室,合肥230601;北京智创信安信息科技有限公司,北京100080;河海大学物联网工程学院,江苏常州213022

融合词典与对抗迁移的越南语事件实体识别

薛振宇;线岩团;余正涛;高盛祥;普浏清-昆明理工大学信息工程与自动化学院,昆明 650500;昆明理工大学云南省人工智能重点实验室,昆明 650500

AMR文本生成的数据扩充方法

付叶蔷;李军辉-苏州大学计算机科学与技术学院,江苏苏州 215006

融合多粒度信息与外部知识的短文本匹配模型

梁登玉;刘大明-上海电力大学计算机科学与技术学院,上海200090

结合卷积神经网络和三支决策的入侵检测算法

吴启睿;黄树成-江苏科技大学计算机学院,江苏镇江 212003

结合BERT数据增强的基于词切分的蒙汉神经机器翻译系统

何乌云;秀芝;包晶晶;陈美兰;王斯日古楞-内蒙古师范大学计算机科学技术学院,内蒙古呼和浩特 011500

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。