基于神经网络的复杂垃圾信息过滤算法分析|张建;严珂;马祥 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于神经网络的复杂垃圾信息过滤算法分析

文献摘要：

垃圾信息的识别是自然语言处理方面主要的任务之一.传统方法是基于文本特征或词频的方法,其识别准确率主要依赖于特定关键词的出现与否,存在对关键词识别错误或对未出现关键词的垃圾信息文本识别能力较差的问题,提出基于神经网络的方法.首先,利用传统方法针对这一类垃圾信息文本进行识别训练和测试;然后,利用从垃圾短信、广告和垃圾邮件数据集中挑选出传统方法识别困难的垃圾信息,再从原数据集中随机挑选出同样数量的正常信息,将其组成三个无重复数据的新数据集;最后,以卷积神经网络和循环神经网络为基础,建立了三个模型,并在新数据集上进行识别训练.实验结果表明,基于神经网络的方法可以从文本中学习到更好的语义特征,在三个数据集上均能达到98％以上的准确率,高于朴素贝叶斯(NB)、随机森林(RF)、支持向量机(SVM)等传统方法.实验结果还显示,不同的神经网络适用于不同长度的文本分类,由循环神经网络组成的模型擅长识别句子长度的文本,由卷积神经网络组成的模型擅长识别段落长度的文本,由两者共同组成的模型擅长识别篇章长度的文本.

文献关键词：

垃圾信息;识别与过滤;文本特征;词频;神经网络

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

作者姓名：

张建;严珂;马祥

作者机构：

中国计量大学信息工程学院,杭州310018

文献出处：

计算机应用

引用格式：

[1]张建;严珂;马祥-.基于神经网络的复杂垃圾信息过滤算法分析)[J].计算机应用,2022(03):770-777

A类：

B类：

垃圾信息,信息过滤,过滤算法,算法分析,自然语言处理,文本特征,词频,识别准确率,关键词识别,文本识别,识别能力,垃圾短信,广告,垃圾邮件,件数,挑选出,方法识别,重复数据,新数据,循环神经网络,语义特征,朴素贝叶斯,NB,RF,同长,文本分类,擅长,别句,句子,子长,段落,识别与过滤

AB值：

0.344439

相似文献

基于子词级别词向量和指针网络的朝鲜语句子排序

闫晓东;解晓庆-中央民族大学信息工程学院,北京 100089;国家语言资源监测与少数民族语言中心,北京 100089

结合注意力机制与图卷积网络的汉语复句关系识别

郑浩;李源;沈威;陈佳杰-华中师范大学计算机学院,湖北武汉 430079;华中师范大学语言与语言教育研究中心,湖北武汉 430079

改进卷积神经网络的文本主题识别算法研究

邱宁佳;杨长庚;王鹏;任涛-长春理工大学计算机科学技术学院,长春 130022

融合高低层语义信息的自然语言句子匹配方法

姜克鑫;赵亚慧;崔荣一-延边大学智能信息处理研究室,吉林延吉 133002

卷积融合文本和异质信息网络的学术论文推荐算法

吴俊超;刘柏嵩;沈小烽;张雪垣-宁波大学信息科学与工程学院,浙江宁波315211

基于DeepFM和卷积神经网络的集成式多模态谣言检测方法

陈志毅;隋杰-中国科学院大学工程科学学院北京 100049

融合字根信息的卷积神经网络中文分词方法

王星;于丽美;陈吉-辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105

融合文本特征的老挝语文字识别方法研究

杨志婥琪;周兰江;周蕾越-昆明理工大学信息工程与自动化学院,昆明650500;昆明理工大学津桥学院电子与信息工程学院,昆明650106

基于多通道注意力机制的文本分类模型

李超凡;马凯-徐州医科大学医学信息与工程学院,江苏徐州221004

基于图注意力网络的方面级别文本情感分析

施荣华;金鑫;胡超-中南大学计算机学院,长沙 410083;中南大学大数据研究院,长沙 410083

基于改进BiGRU-CNN的中文文本分类方法

陈可嘉;刘惠-福州大学经济与管理学院,福州 350116

基于CNN-BiLSTM模型的日志异常检测方法

孙嘉;张建辉;卜佑军;陈博;胡楠;王方玉-郑州大学中原网络安全研究院,郑州450001;中国人民解放军战略支援部队信息工程大学,郑州450001

融合多通道CNN与BiGRU的字词级文本错误检测模型

郭可翔;王衡军;白祉旭-信息工程大学密码工程学院,郑州 450001;中国人民解放军96714部队,福建永安 366001

结合残差BiLSTM与句袋注意力的远程监督关系抽取

江旭;钱雪忠;宋威-江南大学人工智能与计算机学院,江苏无锡 214112

基于滑动窗口注意力网络的关系分类模型

潘理虎;陈亭亭;闫慧敏;赵彭彭;张睿;张英俊-太原科技大学计算机科学与技术学院,山西太原 030024;中国科学院地理科学与资源研究所,北京 100101

基于深度学习和支持向量机的文本分类模型

何铠;管有庆;龚锐-南京邮电大学物联网学院,江苏南京 210003

基于BERT和混合神经网络的诈骗电话文本识别

许鸿奎;周俊杰;姜彤彤;卢江坤;张子枫;胡文烨-山东建筑大学信息与电气工程学院,山东济南 250101;山东省智能建筑技术重点实验室,山东济南 250101

基于句向量和卷积神经网络的文本聚类研究

贾君霞;王会真;任凯;康文-兰州交通大学电子与信息工程学院,兰州 730070;国电甘肃新能源有限公司,兰州 730070

联合注意力机制与MatchPyramid的文本相似度分析算法

代翔;孙海春;朱容辰;孙天杨-中国人民公安大学信息网络安全学院,北京 100038

基于知识增强的图卷积神经网络的文本分类

王婷;朱小飞;唐顾-重庆理工大学计算机科学与工程学院,重庆 400054

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。