典型文献
自适应短文本关键词生成模型
文献摘要:
关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键.为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN.模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题.同时采用了一种线性解码方案,生成了可解释的关键词.在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签.实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响.所提模型在公开数据集KP20 k上仍表现良好,具有较好的可移植性.
文献关键词:
关键词提取;关键词生成;图神经网络;注意力机制;主题模型
中图分类号:
作者姓名:
王永剑;孙亚茹;杨莹
作者机构:
公安部第三研究所,上海 201204
文献出处:
引用格式:
[1]王永剑;孙亚茹;杨莹-.自适应短文本关键词生成模型)[J].北京航空航天大学学报,2022(02):199-208
A类:
ADGCN,KP20
B类:
短文本,文本关键词,关键词生成,生成模型,关键词抽取,文本处理,流畅,关键词提取,中词,文本主题,多语言,序列学习,图神经网络,注意力机制,文本信息,信息特征,位置特征,特征编码,文本结构,存在关联,复杂信息,解码,可解释,社交平台,标签数据集,用户需求,需求角度,信息量,连贯性,评估和分析,解数,数据扰动,公开数据集,可移植性,主题模型
AB值:
0.380404
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。