典型文献
不平衡数据中基于权重的边界混合采样
文献摘要:
针对单一的不平衡数据分类算法合成样本质量不佳、未考虑类内样本分布等局限性,提出一种不平衡数据中基于权重的边界混合采样(boundary mixed sampling based on weight selection in imbalanced data,BWBMS).剔除噪声样本并引入边界因子概念,把原样本空间分成边界集和非边界集;考虑类内样本分布,对于边界集中每个少数类样本赋予支持度权重和密度权重并增加采样比重将其划分为两类,对两类样本子集采用不同的过采样算法和过采样倍率;考虑不同区域样本重要性的不同,根据多数类样本距离其最近的k个异类近邻的平均距离来删减部分非边界集多数类样本点.实验结果表明,结合SVM分类器的BWBMS算法在不同数据集上的性能指标得到了提升,验证了其有效性.
文献关键词:
不平衡数据;分类;权重;边界因子;混合采样
中图分类号:
作者姓名:
姜新盈;江开忠;严涛;王舒梵
作者机构:
上海工程技术大学 数理与统计学院,上海 201620
文献出处:
引用格式:
[1]姜新盈;江开忠;严涛;王舒梵-.不平衡数据中基于权重的边界混合采样)[J].计算机工程与设计,2022(05):1265-1272
A类:
BWBMS,异类近邻
B类:
混合采样,不平衡数据分类,分类算法,合成样本,样本分布,boundary,mixed,sampling,weight,selection,imbalanced,data,除噪声,边界因子,原样,样本空间,边界集,少数类,支持度,样本子,子集,集采,过采样,采样算法,倍率,删减,样本点,分类器
AB值:
0.377846
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。