首站-论文投稿智能助手
典型文献
基于BERT-RCNN的中文违规评论识别研究
文献摘要:
以网络暴力为主的恶意攻击行为已经导致多起恶性事件发生,违规评论问题引起了社会广泛关注.当前违规评论检测手段主要是依靠敏感词屏蔽的方式,这种方式无法有效识别不含低俗用语的恶意评论.该文通过爬虫及人工标注的方式建立一个中文违规评论数据集,采用BERT预训练模型进行词嵌入操作,以保留文本隐含的语义信息.在BERT基础上再利用结合注意力机制的RCNN进一步提取评论的上下文特征,并加入多任务学习联合训练提升模型分类精度及泛化能力.该模型不再完全依赖敏感词库.实验结果表明,该文提出的模型相比传统模型可以更好地理解语义信息,利于发现潜在恶意.该文模型在识别中文违规评论数据集时精确率达到了 94.24%,比传统TextRNN高8.42%,比结合注意力机制的TextRNN高6.92%.
文献关键词:
违规评论识别;迁移学习;BERT预训练模型
作者姓名:
吴浩;潘善亮
作者机构:
宁波大学信息科学与工程学院,浙江宁波315211
文献出处:
引用格式:
[1]吴浩;潘善亮-.基于BERT-RCNN的中文违规评论识别研究)[J].中文信息学报,2022(01):92-103
A类:
违规评论识别
B类:
BERT,RCNN,网络暴力,恶意攻击,攻击行为,多起,恶性事件,检测手段,敏感词,屏蔽,低俗,恶意评论,爬虫,评论数据,预训练模型,词嵌入,语义信息,注意力机制,上下文特征,多任务学习,联合训练,模型分类,分类精度,泛化能力,词库,传统模型,解语,精确率,TextRNN,迁移学习
AB值:
0.38872
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。