典型文献
基于边界增强和去噪的自适应双权重过采样方法研究
文献摘要:
类别不平衡是现实世界普遍存在的问题,其严重影响着各种预测模型的预测效果,使得这些模型仅能准确识别出多类样本,却不易识别出少类样本.本文提出一种基于边界增强和去噪的自适应双权重过采样(Adaptive Double-Weight En-hanced Boundary and Denoising Oversampling,ADWEBDO)方法,以处理不平衡问题.ADWEBDO的主要思想是:引人K近邻(K Nearest Neighbor,KNN)去噪技术,降低噪声样本合成的可能性;提出一种基于类间距离和少类簇大小的双重权重样本分配方法,有效避免了类重叠现象的产生;采用模糊C均值(Fuzzy C-Means,FCM)聚类算法,对样本进行聚类分析,提高了合成少类样本的可靠性;提出一种基于特征空间的合成样本策略,增加了合成少类样本的多样性和合理性.最终,本文提出的方法在7个UCI数据集上进行实验,并取得了令人满意的结果.
文献关键词:
类别不平衡;边界增强;去噪;双权重;过采样
中图分类号:
作者姓名:
高子寒;宋燕
作者机构:
上海理工大学光电信息与计算机工程学院,上海200093
文献出处:
引用格式:
[1]高子寒;宋燕-.基于边界增强和去噪的自适应双权重过采样方法研究)[J].智能计算机与应用,2022(01):58-64
A类:
ADWEBDO
B类:
边界增强,双权重,过采样,采样方法,类别不平衡,现实世界,准确识别,Adaptive,Double,Weight,En,hanced,Boundary,Denoising,Oversampling,不平衡问题,近邻,Nearest,Neighbor,KNN,去噪技术,低噪声,类间距离,重样,分配方法,类重叠,Fuzzy,Means,FCM,聚类算法,特征空间,合成样本,UCI,令人满意
AB值:
0.494119
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。