典型文献
基于标记相关性和ReliefF的多标记特征选择
文献摘要:
针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法.首先,根据正类样本在标记集合中的所占比例定义标记权重,结合互信息和标记权重,构建特征与标记集合之间的相关度计算公式,有效反映特征与标记集的相关性,进而提高算法的分类精度.然后,依据ReliefF模型中的距离计算公式,分别计算样本与最近邻异类样本、最近邻同类样本的距离,提出一种新的样本分类间隔,结合标记权重与分类间隔构建新的特征权值更新公式,有效解决了传统ReliefF算法中因样本间距离过大导致异类样本和同类样本失效的问题.最后,结合标记相关性和改进的ReliefF算法,设计了一种新的多标记特征选择算法.在7个多标记数据集上选择不同评价指标,对所提多标记特征选择算法进行仿真实验与分析,实验结果表明所提算法是有效的.
文献关键词:
多标记学习;特征选择;标记相关性;ReliefF
中图分类号:
作者姓名:
孙林;杜雯娟;李硕;徐久成
作者机构:
河南师范大学计算机与信息工程学院,河南新乡 453007
文献出处:
引用格式:
[1]孙林;杜雯娟;李硕;徐久成-.基于标记相关性和ReliefF的多标记特征选择)[J].西北大学学报(自然科学版),2022(05):834-846
A类:
B类:
标记相关性,ReliefF,多标记特征选择,特征选择算法,分类精度,无意义,选择方法,互信息,相关度计算,距离计算,最近邻,异类,特征权值,多标记数据,上选,多标记学习
AB值:
0.226478
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。