在线评论可行动信息识别研究|商丽丽;唐华云;王延昭;左美云|中国人民大学信息学院北京100871 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

在线评论可行动信息识别研究

文献摘要：

[目的]以评论文本为研究对象,研究可行动信息识别方法,为实践者发挥自身优势及弥补不足提供行动参考.[方法]将目标任务定义为句子级分类问题,提出一种基于文段的可行动信息识别模型SAII.基于BERT预训练模型对输入句子进行编码,建立词级别的上下文表征;枚举句子中不同范围的文段,引入文段注意力机制生成信息量丰富的文段级表征;为缓解噪声问题,提出多通道文段过滤机制,最大限度地保留接近关键元素原型的文段;融合提纯后的文段表示和上下文表示,自动识别可行动信息.[结果]在两个真实数据集上的实验结果表明,所提模型的效果最佳.与三类基线模型中的最优模型相比,SAII模型在Yelp数据集和RateMDs数据集上的F1指标分别提高7.91个百分点和5.42个百分点;2.10个百分点和2.73个百分点;1.94个百分点和1.46个百分点.[局限]仍需在多领域和多模态数据集上广泛验证模型的有效性.[结论]本文模型具备词级和文段级表征能力,有效提高了识别准确率,推动了用户生成内容的价值实现.

文献关键词：

文本评论;文段模型;自然语言处理;可行动信息;BERT

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 文化、科学、教育、体育（G） / 教育（G4） / 电化教育（G43） / 计算机化教学（G434）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

作者姓名：

商丽丽;唐华云;王延昭;左美云

作者机构：

中央国债登记结算有限责任公司博士后科研工作站北京100033;中国人民大学信息学院北京100871;中债金科信息技术有限公司区块链实验室北京100044

文献出处：

数据分析与知识发现

引用格式：

[1]商丽丽;唐华云;王延昭;左美云-.在线评论可行动信息识别研究)[J].数据分析与知识发现,2022(12):1-12

A类：

可行动信息,SAII,RateMDs,文段模型

B类：

在线评论,信息识别,评论文本,实践者,补不足,目标任务,句子级,分类问题,识别模型,BERT,预训练模型,上下文,枚举,注意力机制,信息量,噪声问题,多通道,过滤机制,关键元素,提纯,自动识别,真实数据,基线模型,最优模型,Yelp,百分点,多模态数据集,验证模型,表征能力,识别准确率,用户生成内容,价值实现,文本评论,自然语言处理

AB值：

0.291897

相似文献

融合BERT与标签语义注意力的文本多标签分类方法

吕学强;彭郴;张乐;董志安;游新冬-网络文化与数字传播北京市重点实验室(北京信息科技大学),北京100101

基于BERT的三阶段式问答模型

彭宇;李晓瑜;胡世杰;刘晓磊;钱伟中-电子科技大学信息与软件工程学院,成都610054

基于刑事Electra的编-解码关系抽取模型

王小鹏;孙媛媛;林鸿飞-大连理工大学计算机科学与技术学院,辽宁大连116024

基于BERT的初等数学文本命名实体识别方法

张毅;王爽胜;何彬;叶培明;李克强-重庆邮电大学通信与信息工程学院,重庆400065

知识图谱增强的科普文本分类模型