首站-论文投稿智能助手
典型文献
基于核极限学习机的多标签数据流集成分类方法
文献摘要:
极限学习机因具有高效处理、性能优越以及更少人工参数设定等优点,已成功应用于批处理多标签分类问题.然而,实际应用领域涌现的数据流呈现海量快速、多标签和概念漂移等特点,使得这些传统的多标签分类算法面临精度与时空的挑战.本文提出一种基于核极限学习机的多标签数据流集成分类方法.首先,为适应数据流环境,利用滑动窗口机制将数据流划分为数据块,在前k个数据块上构建k个核极限学习机的集成分类模型;同时,考虑类标签相关性,利用Apriori算法得到每个数据块的标签间的关联规则,并将关联规则中的同现标签的置信度引入到基于集成模型的预测过程中,以提高整体的分类精度;其次,引入MUENLForeset模型检测新到来的数据块是否发生概念漂移,对分类器设置损失函数更新集成模型以适应概念漂移问题.最后,在实际多标签数据上的大量实验表明:与经典多标签批处理和流数据分类方法相比,所提方法不仅能适应多标签数据流中的概念漂移问题,同时在分类精度上具有显著优势.
文献关键词:
多标签分类;数据流;核极限学习机;标签相关性;概念漂移
作者姓名:
张海翔;李培培;胡学钢
作者机构:
大数据知识工程教育部重点实验室(合肥工业大学),合肥 230601;合肥工业大学计算机与信息学院,合肥230601
文献出处:
引用格式:
[1]张海翔;李培培;胡学钢-.基于核极限学习机的多标签数据流集成分类方法)[J].数据采集与处理,2022(01):183-193
A类:
MUENLForeset
B类:
核极限学习机,标签数据,数据流,集成分类,分类方法,高效处理,性能优越,越以,参数设定,成功应用,批处理,多标签分类,分类问题,概念漂移,分类算法,滑动窗口机制,数据块,分类模型,标签相关性,Apriori,关联规则,同现,置信度,集成模型,分类精度,模型检测,分类器,损失函数,新集,签批,流数据,数据分类,显著优势
AB值:
0.259791
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。