典型文献
基于文本分类的Fisher Score快速多标记特征选择算法
文献摘要:
Fisher Score(FS)是一种快速高效的评价特征分类能力的指标,但传统的FS指标既无法直接应用于多标记学习,也不能有效处理样本极值导致的类中心与实际类中心的误差.提出一种结合中心偏移和多标记集合关联性的FS多标记特征选择算法,找出不同标记下每类样本的极值点,以极值点到该类样本的中心距离乘以半径系数筛选新的样本,从而获得分布更为密集的样本集合,以此计算特征的FS得分,通过整体遍历全体样本的标记集合中的每个标记,并在遍历过程中针对具有更多标记数量的样本自适应地赋以标记权值,得到整体特征的平均FS得分,以特征的FS得分进行排序过滤出目标子集实现特征选择目标.在8个公开的多标记文本数据集上进行参数分析及5种指标性能比较,结果表明,该算法具有一定的有效性和鲁棒性,在多数指标上优于MLNB、MLRF、PMU、MLACO等多标记特征选择算法.
文献关键词:
多标记分类;特征选择;Fisher Score指标;距离度量;类间散度
中图分类号:
作者姓名:
汪正凯;沈东升;王晨曦
作者机构:
福建省粒计算及其应用重点实验室,福建 漳州 363000;闽南师范大学 计算机学院,福建 漳州 363000
文献出处:
引用格式:
[1]汪正凯;沈东升;王晨曦-.基于文本分类的Fisher Score快速多标记特征选择算法)[J].计算机工程,2022(02):113-124
A类:
MLNB,MLRF,MLACO,类间散度
B类:
文本分类,Fisher,Score,多标记特征选择,特征选择算法,FS,快速高效,特征分类,接应,多标记学习,类中心,记下,每类,极值点,中心距,乘以,半径系数,样本集合,遍历,记数,权值,整体特征,滤出,子集,文本数据,参数分析,指标性,性能比较,PMU,多标记分类,距离度量
AB值:
0.327236
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。