典型文献
AdaBoost的样本权重与组合系数的分析及改进
文献摘要:
针对自适应增强(AdaBoost)算法的基分类器线性组合效率低以及过度关注难分样本的问题,提出了基于间隔理论的两种改进算法WPIAda与WPIAda.M.首先,WPIAda与WPIAda.M算法都将样本权值的更新分为四种情形,从而增加间隔从正到负变化的样本权值来抑制间隔的负向移动,并减少间隔处于零点的样本数量;其次,WPIAda.M算法根据基分类器的错误率与样本权重的分布状态,给出新的基分类器系数求解方法,从而提高基分类器的组合效率.在10个UCI数据集上,与dfAda、skAda、swaAda等算法相比,WPIAda和WPIAda.M算法的测试误差分别平均降低了7.46个百分点和7.64个百分点;AUC分别提高了11.65个百分点和11.92个百分点.实验结果表明,WPIAda和WPIAda.M算法可以有效降低对难分样本的关注,并且WPIAda.M算法能够更高效地集成基分类器,因此两种算法均可进一步提高分类性能.
文献关键词:
自适应增强;间隔理论;样本权重;基分类器;组合效率
中图分类号:
作者姓名:
朱亮;徐华;成金海;朱深
作者机构:
江南大学人工智能与计算机学院,江苏无锡214122
文献出处:
引用格式:
[1]朱亮;徐华;成金海;朱深-.AdaBoost的样本权重与组合系数的分析及改进)[J].计算机应用,2022(07):2022-2029
A类:
间隔理论,WPIAda,dfAda,skAda,swaAda
B类:
AdaBoost,样本权重,组合系数,分析及改进,自适应增强,基分类器,线性组合,组合效率,难分,分样,改进算法,权值,少间,零点,样本数量,错误率,分布状态,系数求解,求解方法,UCI,测试误差,百分点,分类性能
AB值:
0.241129
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。