首站-论文投稿智能助手
典型文献
半监督AUC优化的Boosting算法及理论
文献摘要:
ROC曲线下面积(Area Under the ROC Curve,AUC)是类不均衡/二分排序等问题中的标准评价指标之一.本文主要聚焦于半监督AUC优化方法.现有大多数方法局限于通过单一模型进行半监督AUC优化,对如何通过模型集成技术融合多个模型则鲜有涉及.考虑上述局限性,本文主要研究基于模型集成的半监督AUC优化方法.具体而言,本文提出一种基于Boosting算法的半监督AUC优化算法,并提出基于权重解耦的加速策略以降低算法时间/空间复杂度.进一步地,在优化层面,本文通过理论分析证明了所提出的算法相对于弱分类器的增加具有指数收敛速率;在模型泛化能力层面,本文构造了所提出算法的泛化误差上界,并证明增加弱分类器个数在提升训练集性能的同时并不会带来明显的过拟合风险.最后,本文在16个基准数据集上对所提出算法的性能进行了验证,实验结果表明所提出算法在多数情况下以0.05显著水平优于其他对比方法,并可在平均意义上产生0.9%~11.28%的性能提升.
文献关键词:
AUC优化;集成学习;半监督学习;提升法;Rademacher复杂度
作者姓名:
杨智勇;许倩倩;何源;操晓春;黄庆明
作者机构:
中国科学院大学计算机科学与技术学院 北京 101408;中国科学院计算技术研究所智能信息处理重点实验室 北京 100190;阿里安全图灵实验室 北京 100102;中国科学院信息工程研究所信息安全国家重点实验室 北京 100093;中国科学院大数据挖掘与知识管理重点实验室,中国科学院大学 北京 101408;鹏城实验室 广东深圳 518055
文献出处:
引用格式:
[1]杨智勇;许倩倩;何源;操晓春;黄庆明-.半监督AUC优化的Boosting算法及理论)[J].计算机学报,2022(08):1598-1617
A类:
B类:
Boosting,Area,Under,Curve,分排,标准评价,模型集成,集成技术,技术融合,基于模型,解耦,加速策略,空间复杂度,弱分类器,指数收敛,收敛速率,模型泛化,泛化能力,泛化误差,上界,训练集,过拟合,基准数据集,显著水平,比方,性能提升,集成学习,半监督学习,提升法,Rademacher
AB值:
0.441431
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。