首站-论文投稿智能助手
典型文献
CAT-RFE:点击欺诈的集成检测框架
文献摘要:
点击欺诈是近年来最常见的网络犯罪手段之一,互联网广告行业每年都会因点击欺诈而遭受巨大损失.为了能够在海量点击中有效地检测欺诈点击,构建了多种充分结合广告点击与时间属性关系的特征,并提出了一种点击欺诈检测的集成学习框架——CAT-RFE集成学习框架.CAT-RFE集成学习框架包含3个部分:基分类器、递归特征消除(RFE,recursive feature elimination)和voting集成学习.其中,将适用于类别特征的梯度提升模型——CatBoost(categorical boosting)作为基分类器;RFE是基于贪心策略的特征选择方法,可在多组特征中选出较好的特征组合;Voting集成学习是采用投票的方式将多个基分类器的结果进行组合的学习方法.该框架通过CatBoost和RFE在特征空间中获取多组较优的特征组合,再在这些特征组合下的训练结果通过voting进行集成,获得集成的点击欺诈检测结果.该框架采用了相同的基分类器和集成学习方法,不仅克服了差异较大的分类器相互制约而导致集成结果不理想的问题,也克服了RFE在选择特征时容易陷入局部最优解的问题,具备更好的检测能力.在实际互联网点击欺诈数据集上的性能评估和对比实验结果显示,CAT-RFE集成学习框架的点击欺诈检测能力超过了CatBoost模型、CatBoost和RFE组合的模型以及其他机器学习模型,证明该框架具备良好的竞争力.该框架为互联网广告点击欺诈检测提供一种可行的解决方案.
文献关键词:
点击欺诈检测;类别梯度提升;递归特征消除;集成学习
作者姓名:
卢翼翔;耿光刚;延志伟;朱效民;张新常
作者机构:
暨南大学网络空间安全学院,广东广州510632;中国互联网络信息中心,北京 100190;山东齐鲁大数据研究院,山东济南 250001;山东省科学院,山东济南 250001
引用格式:
[1]卢翼翔;耿光刚;延志伟;朱效民;张新常-.CAT-RFE:点击欺诈的集成检测框架)[J].网络与信息安全学报,2022(05):158-166
A类:
点击欺诈检测,类别梯度提升
B类:
CAT,RFE,检测框架,网络犯罪,互联网广告,广告行业,巨大损失,击中,集成学习框架,基分类器,递归特征消除,recursive,feature,elimination,voting,类别特征,CatBoost,categorical,boosting,贪心策略,特征选择,选择方法,特征组合,Voting,投票,特征空间,集成学习方法,相互制约,局部最优解,检测能力,网点,性能评估,机器学习模型
AB值:
0.24267
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。