首站-论文投稿智能助手
典型文献
BETES:一种中文长文档抽取式摘要方法
文献摘要:
文本摘要在自然语言处理领域是最重要的研究工作之一,并随着深度学习的兴起成为研究热点,而中文长文本的摘要抽取面临更大的挑战,存在长文本-摘要语料库不足、摘要抽取信息不准确、目标摘要冗余、摘要句缺失等问题.本文以中文长文本的摘要抽取为研究对象,提出一种BETES方法,基于规则和人工辅助筛选构建中文长文本-摘要语料库;利用Bert预处理模型进行文本向量化,更好地捕捉长文本上下文的语义,提升信息抽取的准确性;在识别中文长文本的基本篇章单元的基础上,以基本篇章单元为抽取对象,降低摘要抽取的冗余度;最后利用Transformer神经网络抽取模型,实现基本篇章单元的抽取,提升摘要句抽取的准确率.实验证明,提出的BETES方法在中文长文本的抽取式摘要过程中提高了准确性,降低了冗余度,并且ROUGE分数优于主流的摘要抽取方法.
文献关键词:
文本摘要;抽取式摘要;Bert;基本篇章单元;Transformer
作者姓名:
王宗辉;李宝安;吕学强;游新冬
作者机构:
北京信息科技大学 网络文化与数字传播北京市重点实验室,北京100101;北京信息科技大学 计算机学院,北京100101
引用格式:
[1]王宗辉;李宝安;吕学强;游新冬-.BETES:一种中文长文档抽取式摘要方法)[J].小型微型计算机系统,2022(01):42-49
A类:
BETES,基本篇章单元
B类:
长文,文档,抽取式摘要,文本摘要,自然语言处理,摘要抽取,语料库,取信,基于规则,Bert,处理模型,文本向量化,上下文,信息抽取,冗余度,Transformer,取模,ROUGE
AB值:
0.187736
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。