典型文献
面向非平衡数据的大间隔近邻Relief算法
文献摘要:
Relief算法对于数据重叠区域的样本分类较为困难,通过人为剔除分类边界的样本来缓解干扰数据对于分类性能的影响.在非平衡数据中,重叠区域包含着为数不多的少数类样本,简单地剔除干扰数据可能会造成信息的丢失.针对这一问题,文章提出了一种面向非平衡数据的大间隔近邻Relief算法,该算法首先结合K-means,提供了两种多数类样本的欠采样方案,以获得较为平衡的新采样数据集.然后利用SVM计算新数据集中最具判别性的方向,并依此设计了一种基于大间隔的近邻计算方式,从而尽可能避开干扰数据.在6个非平衡数据集上的实验表明,在现有代表性算法的基础上,文章提出的算法仅利用31%~57%数量的特征即可达到相当或更高的分类性能.
文献关键词:
非平衡数据;欠采样;特征选择;Relief;大间隔
中图分类号:
作者姓名:
程凤伟;常浩
作者机构:
太原学院 计算机科学与技术系,山西 太原 030032
文献出处:
引用格式:
[1]程凤伟;常浩-.面向非平衡数据的大间隔近邻Relief算法)[J].山西大学学报(自然科学版),2022(04):1014-1022
A类:
B类:
大间隔,近邻,Relief,重叠区域,干扰数据,分类性能,为数不多,少数类,剔除干扰,means,欠采样,采样数据,新数据,判别性,依此,计算方式,避开,非平衡数据集,特征选择
AB值:
0.271567
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。