典型文献
基于集成学习与不平衡数据的返贫预测
文献摘要:
中国在扶贫工作取得决定性成就的同时,仍有一些脱贫人口存在返贫风险.本文基于不平衡数据集,利用SMOTE模型对返贫类别样本进行过采样处理,处理后的返贫与未返贫样本数据比例为3:1;接着建立基于Stacking集成学习的返贫预测模型,利用网格搜索对各个模型超参数进行寻优,结合10折交叉验证提高模型的泛化能力.本文使用4种不同的融合模型对脱贫户是否返贫进行预测.实验结果表明,与单一模型相比,模型融合后的分类效果要优于单独的分类器,其中最优融合模型的Acc为0.962,F1-score为0.946.
文献关键词:
返贫预测;过采样技术;集成学习;融合模型
中图分类号:
作者姓名:
龚云翔;袁仕芳;刘付谦
作者机构:
五邑大学数学与计算科学学院,广东 江门 529020
文献出处:
引用格式:
[1]龚云翔;袁仕芳;刘付谦-.基于集成学习与不平衡数据的返贫预测)[J].计算机与现代化,2022(04):12-16
A类:
返贫预测
B类:
集成学习,扶贫工作,脱贫人口,返贫风险,不平衡数据集,SMOTE,别样,Stacking,网格搜索,超参数,交叉验证,泛化能力,融合模型,脱贫户,模型融合,分类效果,分类器,最优融合,Acc,score,过采样技术
AB值:
0.367436
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。