典型文献
基于ADASYN-SFS-RF的欺诈检测模型泛化性能提升及可解释性研究
文献摘要:
针对行业欺诈行为形式多样、操作隐蔽,且数据分布极端不平衡等问题,研究采用ADASYN(adaptive synthetic sampling approach for imbalanced learning)算法将分类决策边界向困难的实例进行自适应移动实现数据扩增,以解决不平衡数据造成的过拟合问题.采用基于随机森林的序列向前搜索策略算法筛选出最优特征子集对欺诈进行检测,降低ADASYN算法添加噪声数据对分类边界确定的影响,构建欺诈检测模型,并使用LIME对模型检测结果作出局部解释,提高模型的使用价值.实验表明,该模型可以较好地克服传统欺诈检测模型对多数类样本误分类的缺陷,有助于提高行业对交易欺诈行为识别的效率.同时,通过LIME对模型检测出的随机样本进行有效解析,便于决策者对算法模型的检测结果作出实证分析,起到明显的预警及决策参考价值.
文献关键词:
欺诈检测;随机森林;ADASYN;LIME;特征选择
中图分类号:
作者姓名:
汪万敏;智路平
作者机构:
上海理工大学 管理学院,上海200093
文献出处:
引用格式:
[1]汪万敏;智路平-.基于ADASYN-SFS-RF的欺诈检测模型泛化性能提升及可解释性研究)[J].计算机应用研究,2022(12):3605-3613
A类:
B类:
ADASYN,SFS,RF,欺诈检测,检测模型,模型泛化性,泛化性能,性能提升,可解释性研究,欺诈行为,数据分布,adaptive,synthetic,sampling,approach,imbalanced,learning,分类决策,决策边界,自适应移动,数据扩增,决不,不平衡数据,过拟合,搜索策略,优特,特征子集,噪声数据,LIME,模型检测,出局,局部解,使用价值,误分类,高行,行为识别,随机样本,决策者,算法模型,决策参考,特征选择
AB值:
0.460091
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。