典型文献
基于伪标签一致度的不平衡数据特征选择算法
文献摘要:
针对大多数粒计算特征选择算法未考虑数据的类别不平衡性的问题,提出一种融合伪标签策略的类别不平衡数据特征选择算法.首先,为了便于研究类别不平衡数据特征选择算法,重新定义样本和数据集一致度的概念,并设计了相应特征选择的贪婪前向搜索算法;其次,引入伪标签策略以平衡数据的类别分布,并将所学样本的伪标签融入一致性测度中,以构造伪标签一致度来估计类别不平衡数据集的特征;最后,通过保持类别不平衡数据集的伪标签一致度不变,设计一种面向类别不平衡数据的基于伪标签一致性的特征选择算法(PLCFS).实验结果表明,所提PLCFS的性能仅次于最大相关最小冗余(mRMR)算法,而优于Relief算法和基于一致性的特征选择算法(CFS).
文献关键词:
粒计算;伪标签;类别不平衡数据;特征选择;一致性测度
中图分类号:
作者姓名:
李懿恒;杜晨曦;杨燕燕;李翔宇
作者机构:
北京交通大学软件学院,北京100044
文献出处:
引用格式:
[1]李懿恒;杜晨曦;杨燕燕;李翔宇-.基于伪标签一致度的不平衡数据特征选择算法)[J].计算机应用,2022(02):475-484
A类:
一致性测度,PLCFS
B类:
伪标签,数据特征,特征选择算法,数粒,粒计算,不平衡性,类别不平衡数据,重新定义,贪婪,向搜索,搜索算法,所学,学样,不平衡数据集,仅次于,最大相关最小冗余,mRMR,Relief
AB值:
0.183894
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。