典型文献
基于BERT_DPCNN文本分类算法的垃圾邮件过滤系统
文献摘要:
近年来,研究表明垃圾邮件已经出现在私人邮箱中,严重扰乱了用户体验.这也已成为各大通信公司的优先研究事项.基于传统的机器学习算法垃圾邮件过滤模型已经得到了充分的研究.随着研究人员在自然语言处理方面的深入研究,深度学习算法及其构建的模型表现效果远强于传统机器学习模型.本文基于现有的各类分类模型进行了研究及比较,讨论了如何对垃圾邮件数据集进行识别,并建立了BERT_DPCNN模型,以改进对电子邮件这种具有独特特征文本的识别方法.本文使用DPCNN作为垃圾邮件分类器,使用BERT预训练模型得到的文本向量作为DPCNN模型的输入,以此加强模型的分类效果,有助于提取到更多的语义信息,以此避免出现深度神经网络梯度消失所带来的问题.根据模型的召回率、准确率和F1指数,BERT_DPCNN模型可以比其他模型更有效地识别垃圾邮件.此外,从实验数据中可以看出,一些涉及深度模型的特征提取方法,如本文中的BERT模型,比基于word2vec的特征提取方法具有更明显的优势.本文构建的BERT_DPCNN模型可以存储更多的语义环境信息,为文本分类提供更多的基础,并提取更深层次的文本特征.它是一个具有最佳整体性能的模型,对垃圾邮件过滤具有重要价值.
文献关键词:
垃圾邮件;分类;BERT;DPCNN
中图分类号:
作者姓名:
彭毅;姜昕宇
作者机构:
阿伯丁大学,英国阿伯丁AB243FX
文献出处:
引用格式:
[1]彭毅;姜昕宇-.基于BERT_DPCNN文本分类算法的垃圾邮件过滤系统)[J].电脑知识与技术,2022(22):66-69
A类:
B类:
BERT,DPCNN,文本分类,分类算法,垃圾邮件,过滤系统,邮箱,扰乱,用户体验,大通,通信公司,先研,机器学习算法,过滤模型,自然语言处理,深度学习算法,机器学习模型,分类模型,件数,电子邮件,独特特征,征文,分类器,预训练模型,文本向量,分类效果,取到,语义信息,避免出现,深度神经网络,梯度消失,失所,召回率,深度模型,比基,word2vec,环境信息,文本特征,整体性能
AB值:
0.342821
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。