基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型|梅侠峰;吴晓鸰;吴杰文;凌捷;Hoon Heo|华为技术有限公司,北京100085 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型

文献摘要：

针对现有微博谣言检测算法在实用场景中存在滞后性,以及传统深度学习模型特征提取能力不足等问题,提出了基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型,仅使用微博原始文本作为模型输入,不包含任何转发和评论信息或者其他相关特征信息.采用RoBERTa预训练模型学习当前词在特定上下文语境中的动态含义,解决静态词向量无法表示多义词的问题,提升词的语义表征能力;通过双向内置注意力简单循环单元(Simple Re-current Unit with Built-in Self-Attenttion)进行深层语义特征抽取,自注意力机制可以捕获句子内部词与词之间的依赖关系,得到更为全面的高维特征;引入软注意力机制计算不同词对分类结果的重要程度,赋予模型聚焦关键特征的能力,解决输出特征对分类结果影响力一致的问题;得到的软注意力特征经Softmax层计算得到分类概率,取概率最大值对应标签为分类结果.在公开的中文微博谣言数据集进行实验,实验结果表明,本文所提出的基于Ro-BERTa-BiSRU++-AT的模型F1分数达到了 98.16％,高于实验对比的其他微博谣言检测算法,证明该模型对微博文本谣言具有更好的早期识别能力.

文献关键词：

谣言检测;RoBERTa;BiSRU;软注意力机制

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 医药、卫生（R） / 肿瘤学（R73） / 消化系肿瘤（R735） / 胃肿瘤（R735.2）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

作者姓名：

梅侠峰;吴晓鸰;吴杰文;凌捷;Hoon Heo

作者机构：

广东工业大学计算机学院,广东广州510006;华为技术有限公司,北京100085;韩国三星电机,韩国水原

文献出处：

微电子学与计算机

引用格式：

[1]梅侠峰;吴晓鸰;吴杰文;凌捷;Hoon Heo-.基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型)[J].微电子学与计算机,2022(02):34-42

A类：

BiSRU++,Attenttion,BERTa

B类：

RoBERTa,AT,微博谣言,早期检测,检测模型,谣言检测,检测算法,滞后性,深度学习模型,模型特征,特征提取能力,模型输入,转发,评论信息,特征信息,预训练模型,模型学习,上下文语境,词向量,多义词,语义表征,表征能力,内置,简单循环单元,Simple,Re,current,Unit,Built,Self,深层语义,语义特征,特征抽取,自注意力机制,句子,依赖关系,高维特征,软注意力机制,重要程度,聚焦关键,关键特征,结果影响,Softmax,应标,签为,中文微博,实验对比,微博文本,早期识别,识别能力

AB值：

0.381306

相似文献

融合字注释的文本分类模型

杨先凤;赵家和;李自强-西南石油大学计算机科学学院,成都610500;四川师范大学影视与传媒学院,成都610066

基于BERT和层次化Attention的微博情感分析研究

赵宏;傅兆阳;赵凡-兰州理工大学计算机与通信学院,兰州 730050;甘肃省科学技术情报研究所,兰州 730000

上下文感知的树递归神经网络下隐式情感分析

陈秋嫦;赵晖;左恩光;赵玉霞;魏文钰-新疆大学信息科学与工程学院,乌鲁木齐 830046;商洛学院数学与计算机应用学院,陕西商洛 726000

融合高低层语义信息的自然语言句子匹配方法

姜克鑫;赵亚慧;崔荣一-延边大学智能信息处理研究室,吉林延吉 133002

基于矩阵分解双线性池化的多模态融合虚假新闻检测