首站-论文投稿智能助手
典型文献
基于局部条件区分能力的高效属性约简算法
文献摘要:
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过采样的方式将条件区分能力扩展为局部条件区分能力,提出基于局部条件区分能力的属性约简算法.理论证明了条件区分能力在属性的选择上比正区域更严格,并将该算法与基于区分度的高效前向属性约简算法(FAR-DV)、基于k近邻属性重要度和相关系数的属性约简算法(K2NCRS)及基于正区域排序升序决策表的快速正区域约简算法(FPRA)进行了对比.实验结果显示,该算法在属性选择顺序、约简率和分类精度上与FAR-DV基本一致,在约简效率上比上述三种算法提高了10倍以上;且随着数据规模的增大或条件属性的增多,在约简效率上的提升越明显.可以看出,所提算法具有更低的时空复杂度,适用于海量数据属性约简.
文献关键词:
属性约简;区分矩阵;区分能力;条件区分能力;大数定律;局部条件区分能力
作者姓名:
康猛;蒙祖强
作者机构:
广西大学计算机与电子信息学院,广西南宁530004
文献出处:
引用格式:
[1]康猛;蒙祖强-.基于局部条件区分能力的高效属性约简算法)[J].计算机应用,2022(02):449-456
A类:
局部条件区分能力,条件区分能力,K2NCRS,序决策表,FPRA
B类:
属性约简,简算,区分矩阵,统属,空间复杂度,规模较,属性选择,大数定律,中频,过采样,区分度,FAR,DV,近邻,属性重要度,升序,分类精度,海量数据,数据属性
AB值:
0.171944
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。