典型文献
基于属性树的并行化增量式动态属性约简算法
文献摘要:
传统增量算法主要侧重于从更新近似的角度进行属性约简,但在处理大规模数据集时需要评估所有属性并反复计算重要度,提升时间复杂度,降低效率.针对上述问题,文中提出基于属性树的并行化增量加速策略,关键步骤是将所有属性聚类成多棵属性树进行并行化动态属性评估.首先,根据属性树相关性度量选择合适的属性树进行属性评估,降低时间复杂度.再增加分支系数至停止准则中,随着分支深度的增加进行动态增加,可使算法在达到最大阈值后自主跳出循环,有效避免原先的冗余计算,提高效率.基于上述策略,提出基于属性树的增量属性约简算法,同时与Spark并行机制结合,设计基于属性树的并行化增量式动态属性约简算法.在多个数据集上的广泛实验表明,文中算法在保持分类性能的同时,可提高动态变化数据集约简的搜索效率,具有较好的性能优势.
文献关键词:
属性约简;属性树;知识粒度;并行计算;增量学习;Spark;框架
中图分类号:
作者姓名:
秦廷桢;丁卫平;鞠恒荣;李铭;黄嘉爽;陈悦鹏;王海鹏
作者机构:
南通大学 信息科学技术学院 南通 226019
文献出处:
引用格式:
[1]秦廷桢;丁卫平;鞠恒荣;李铭;黄嘉爽;陈悦鹏;王海鹏-.基于属性树的并行化增量式动态属性约简算法)[J].模式识别与人工智能,2022(10):939-951
A类:
属性树
B类:
并行化,增量式,动态属性,属性约简,简算,增量算法,新近,大规模数据集,评估所,反复计算,重要度,时间复杂度,低效率,加速策略,关键步骤,多棵,相关性度量,度量选择,加分,分支系数,加进,跳出,原先,冗余计算,提高效率,Spark,并行机制,分类性能,高动态,数据集约,搜索效率,性能优势,知识粒度,并行计算,增量学习
AB值:
0.373421
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。