典型文献
基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型
文献摘要:
针对现有微博谣言检测算法在实用场景中存在滞后性,以及传统深度学习模型特征提取能力不足等问题,提出了基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型,仅使用微博原始文本作为模型输入,不包含任何转发和评论信息或者其他相关特征信息.采用RoBERTa预训练模型学习当前词在特定上下文语境中的动态含义,解决静态词向量无法表示多义词的问题,提升词的语义表征能力;通过双向内置注意力简单循环单元(Simple Re-current Unit with Built-in Self-Attenttion)进行深层语义特征抽取,自注意力机制可以捕获句子内部词与词之间的依赖关系,得到更为全面的高维特征;引入软注意力机制计算不同词对分类结果的重要程度,赋予模型聚焦关键特征的能力,解决输出特征对分类结果影响力一致的问题;得到的软注意力特征经Softmax层计算得到分类概率,取概率最大值对应标签为分类结果.在公开的中文微博谣言数据集进行实验,实验结果表明,本文所提出的基于Ro-BERTa-BiSRU++-AT的模型F1分数达到了 98.16%,高于实验对比的其他微博谣言检测算法,证明该模型对微博文本谣言具有更好的早期识别能力.
文献关键词:
谣言检测;RoBERTa;BiSRU;软注意力机制
中图分类号:
作者姓名:
梅侠峰;吴晓鸰;吴杰文;凌捷;Hoon Heo
作者机构:
广东工业大学计算机学院,广东广州510006;华为技术有限公司,北京100085;韩国三星电机,韩国水原
文献出处:
引用格式:
[1]梅侠峰;吴晓鸰;吴杰文;凌捷;Hoon Heo-.基于RoBERTa-BiSRU++-AT的微博谣言早期检测模型)[J].微电子学与计算机,2022(02):34-42
A类:
BiSRU++,Attenttion,BERTa
B类:
RoBERTa,AT,微博谣言,早期检测,检测模型,谣言检测,检测算法,滞后性,深度学习模型,模型特征,特征提取能力,模型输入,转发,评论信息,特征信息,预训练模型,模型学习,上下文语境,词向量,多义词,语义表征,表征能力,内置,简单循环单元,Simple,Re,current,Unit,Built,Self,深层语义,语义特征,特征抽取,自注意力机制,句子,依赖关系,高维特征,软注意力机制,重要程度,聚焦关键,关键特征,结果影响,Softmax,应标,签为,中文微博,实验对比,微博文本,早期识别,识别能力
AB值:
0.381306
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。