CAT-RFE:点击欺诈的集成检测框架|卢翼翔;耿光刚;延志伟;朱效民;张新常|中国互联网络信息中心,北京 100190 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

CAT-RFE:点击欺诈的集成检测框架

文献摘要：

点击欺诈是近年来最常见的网络犯罪手段之一,互联网广告行业每年都会因点击欺诈而遭受巨大损失.为了能够在海量点击中有效地检测欺诈点击,构建了多种充分结合广告点击与时间属性关系的特征,并提出了一种点击欺诈检测的集成学习框架——CAT-RFE集成学习框架.CAT-RFE集成学习框架包含3个部分:基分类器、递归特征消除(RFE,recursive feature elimination)和voting集成学习.其中,将适用于类别特征的梯度提升模型——CatBoost(categorical boosting)作为基分类器;RFE是基于贪心策略的特征选择方法,可在多组特征中选出较好的特征组合;Voting集成学习是采用投票的方式将多个基分类器的结果进行组合的学习方法.该框架通过CatBoost和RFE在特征空间中获取多组较优的特征组合,再在这些特征组合下的训练结果通过voting进行集成,获得集成的点击欺诈检测结果.该框架采用了相同的基分类器和集成学习方法,不仅克服了差异较大的分类器相互制约而导致集成结果不理想的问题,也克服了RFE在选择特征时容易陷入局部最优解的问题,具备更好的检测能力.在实际互联网点击欺诈数据集上的性能评估和对比实验结果显示,CAT-RFE集成学习框架的点击欺诈检测能力超过了CatBoost模型、CatBoost和RFE组合的模型以及其他机器学习模型,证明该框架具备良好的竞争力.该框架为互联网广告点击欺诈检测提供一种可行的解决方案.

文献关键词：

点击欺诈检测;类别梯度提升;递归特征消除;集成学习

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 计算机网络（TP393）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 自动推理、机器学习（TP181）

作者姓名：

卢翼翔;耿光刚;延志伟;朱效民;张新常

作者机构：

暨南大学网络空间安全学院,广东广州510632;中国互联网络信息中心,北京 100190;山东齐鲁大数据研究院,山东济南 250001;山东省科学院,山东济南 250001

文献出处：

网络与信息安全学报

引用格式：

[1]卢翼翔;耿光刚;延志伟;朱效民;张新常-.CAT-RFE:点击欺诈的集成检测框架)[J].网络与信息安全学报,2022(05):158-166

A类：

点击欺诈检测,类别梯度提升

B类：

CAT,RFE,检测框架,网络犯罪,互联网广告,广告行业,巨大损失,击中,集成学习框架,基分类器,递归特征消除,recursive,feature,elimination,voting,类别特征,CatBoost,categorical,boosting,贪心策略,特征选择,选择方法,特征组合,Voting,投票,特征空间,集成学习方法,相互制约,局部最优解,检测能力,网点,性能评估,机器学习模型

AB值：

0.24267

相似文献

融合信息增益比和遗传算法的混合式特征选择算法

许召召;申德荣;聂铁铮;寇月-东北大学计算机科学与工程学院,辽宁沈阳110819

概念漂移数据流半监督分类综述

文益民;刘帅;缪裕青;易新河;刘长杰-广西图像图形与智能处理重点实验室(桂林电子科技大学), 广西桂林 541004;桂林电子科技大学计算机与信息安全学院, 广西桂林 541004

基于多视角图神经网络的欺诈检测算法

陈卓;朱淼;杜军威-青岛科技大学信息科学技术学院,山东青岛 266061

基于多模态特征融合嵌入的相似广告检索方法

冯奕;周晓松;李传艺;王挺;葛季栋;胡雨成;张小鹏;骆斌-南京大学计算机软件新技术国家重点实验室南京 210046;南京大学软件学院南京 210093;深圳市腾讯计算机系统有限公司广东深圳 518000

半监督AUC优化的Boosting算法及理论