首站-论文投稿智能助手
典型文献
在线评论可行动信息识别研究
文献摘要:
[目的]以评论文本为研究对象,研究可行动信息识别方法,为实践者发挥自身优势及弥补不足提供行动参考.[方法]将目标任务定义为句子级分类问题,提出一种基于文段的可行动信息识别模型SAII.基于BERT预训练模型对输入句子进行编码,建立词级别的上下文表征;枚举句子中不同范围的文段,引入文段注意力机制生成信息量丰富的文段级表征;为缓解噪声问题,提出多通道文段过滤机制,最大限度地保留接近关键元素原型的文段;融合提纯后的文段表示和上下文表示,自动识别可行动信息.[结果]在两个真实数据集上的实验结果表明,所提模型的效果最佳.与三类基线模型中的最优模型相比,SAII模型在Yelp数据集和RateMDs数据集上的F1指标分别提高7.91个百分点和5.42个百分点;2.10个百分点和2.73个百分点;1.94个百分点和1.46个百分点.[局限]仍需在多领域和多模态数据集上广泛验证模型的有效性.[结论]本文模型具备词级和文段级表征能力,有效提高了识别准确率,推动了用户生成内容的价值实现.
文献关键词:
文本评论;文段模型;自然语言处理;可行动信息;BERT
作者姓名:
商丽丽;唐华云;王延昭;左美云
作者机构:
中央国债登记结算有限责任公司博士后科研工作站 北京100033;中国人民大学信息学院 北京100871;中债金科信息技术有限公司区块链实验室 北京100044
引用格式:
[1]商丽丽;唐华云;王延昭;左美云-.在线评论可行动信息识别研究)[J].数据分析与知识发现,2022(12):1-12
A类:
可行动信息,SAII,RateMDs,文段模型
B类:
在线评论,信息识别,评论文本,实践者,补不足,目标任务,句子级,分类问题,识别模型,BERT,预训练模型,上下文,枚举,注意力机制,信息量,噪声问题,多通道,过滤机制,关键元素,提纯,自动识别,真实数据,基线模型,最优模型,Yelp,百分点,多模态数据集,验证模型,表征能力,识别准确率,用户生成内容,价值实现,文本评论,自然语言处理
AB值:
0.291897
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。