FAILED
首站-论文投稿智能助手
典型文献
基于多粒度特征的文本生成评价方法
文献摘要:
近年来,基于预训练语言模型的文本生成评价方法得到了广泛关注,其通过计算两个句子间子词粒度的相似度来评价生成文本的质量.但是对于越南语、泰语等存在大量黏着语素的语言,单个音节或子词不能独立成词表达语义,仅基于子词粒度匹配的方法并不能够完整表征两个句子间的语义相似关系.基于此,该文提出一种基于子词、音节、词组等多粒度特征的文本生成评价方法.首先基于MBERT模型生成文本的表示,然后引入音节、词组等粗粒度语义单元之间的相似性来增强子词粒度的相似度评价模型.在机器翻译、跨语言摘要、跨语言数据筛选等任务上的实验结果表明,该文提出的多粒度特征评价方法相比ROUGE、BLEU等基于统计的评价方法以及Bertscore等基于语义相似度的评价方法都取得了更好的性能,与人工评价结果相关性更高.
文献关键词:
文本生成;评价方法;黏着语素;多粒度特征;MBERT
作者姓名:
赖华;高玉梦;黄于欣;余正涛;张勇丙
作者机构:
昆明理工大学 信息工程与自动化学院,云南 昆明 650504;昆明理工大学 云南省人工智能重点实验室,云南 昆明 650504
文献出处:
引用格式:
[1]赖华;高玉梦;黄于欣;余正涛;张勇丙-.基于多粒度特征的文本生成评价方法)[J].中文信息学报,2022(03):45-53,63
A类:
黏着语素,MBERT,Bertscore
B类:
多粒度特征,文本生成,预训练语言模型,句子,子词,成文,越南语,泰语,音节,立成,成词,词表,相似关系,词组,模型生成,粗粒度,增强子,相似度评价,机器翻译,跨语言摘要,跨语言数据,数据筛选,特征评价,ROUGE,BLEU,语义相似度
AB值:
0.277733
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。