首站-论文投稿智能助手
典型文献
融合拟单层覆盖粗集的集值数据平衡方法研究
文献摘要:
如今不平衡数据存在生活中各个领域,如何有效地对其分类已经成为研究的热点.传统的过采样与欠采样方法虽然能保证数据的平衡性,但无法克服因数据分布和噪声对数据的分类造成的影响.为了降低数据分布与噪声在集值信息系统中对不平衡数据分类的影响,提出了一种基于拟单层覆盖粗集的过采样与欠采样相结合的模型.通过拟单层覆盖粗集DA0与DE0下近似将数据主要划分为两个部分,将属于下近似集的部分用BorderlineSMOTE进行过采样,将不属于下近似集的部分用ClusterCentroids进行欠采样,最终将二者合并即为最终数据集.拟单层覆盖粗集是适用于集值信息系统的高近似质量、快速计算的模型,高近似质量可以使其保留尽可能多的可靠数据来保证模型的泛化能力.通过混合处理方式,不仅能够降低噪声数据对BorderlineSMOTE的影响,还能通过ClusterCen-troids极大程度地保留被过滤数据的信息完整性.通过相关对比实验,采用ExtraTree、DecisionTree、FGCNN等方法,验证了该模型的有效性.
文献关键词:
拟单层覆盖粗集;不平衡数据;近似集;混合处理;过采样;欠采样
作者姓名:
吴正江;杨天;郑爱玲;梅秋雨;张亚宁
作者机构:
河南理工大学 计算机科学与技术学院,河南 焦作 454003
引用格式:
[1]吴正江;杨天;郑爱玲;梅秋雨;张亚宁-.融合拟单层覆盖粗集的集值数据平衡方法研究)[J].计算机工程与应用,2022(19):166-173
A类:
拟单层覆盖粗集,DA0,DE0,BorderlineSMOTE,ClusterCentroids,ClusterCen,troids,ExtraTree,DecisionTree,FGCNN
B类:
数据平衡,平衡方法,在生活中,过采样,欠采样,采样方法,保证数据,平衡性,数据分布,集值信息系统,不平衡数据分类,下近似,近似集,分用,终将,即为,快速计算,泛化能力,混合处理,低噪声,噪声数据
AB值:
0.223536
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。