典型文献
概念漂移数据流半监督分类综述
文献摘要:
在开放环境下,数据流具有数据高速生成、数据量无限和概念漂移等特性.在数据流分类任务中,利用人工标注产生大量训练数据的方式昂贵且不切实际.包含少量有标记样本和大量无标记样本且还带概念漂移的数据流给机器学习带来了极大挑战.然而,现有研究主要关注有监督的数据流分类,针对带概念漂移的数据流的半监督分类的研究尚未引起足够的重视.因此,在全面收集数据流半监督分类研究工作的基础上,对现有带概念漂移的数据流的半监督分类算法进行了多角度划分;并以算法采用的分类器类型为线索,对已有的多个算法进行了介绍与总结,包括现有数据流半监督分类采用的概念漂移检测方法;在一些被广泛使用的真实数据集和人工数据集上,对部分代表性数据流半监督分类算法进行了多方面的比较与分析;最后,提出了当前概念漂移数据流半监督分类中一些值得进一步深入探讨的问题.实验结果表明:数据流半监督分类算法的分类准确率与众多因素有关,但与数据分布的变化关系最大.本综述将有助于感兴趣的研究者快速进入数据流半监督分类问题领域.
文献关键词:
数据挖掘;概念漂移;数据流;集成学习;半监督分类
中图分类号:
作者姓名:
文益民;刘帅;缪裕青;易新河;刘长杰
作者机构:
广西图像图形与智能处理重点实验室(桂林电子科技大学), 广西 桂林 541004;桂林电子科技大学 计算机与信息安全学院, 广西 桂林 541004
文献出处:
引用格式:
[1]文益民;刘帅;缪裕青;易新河;刘长杰-.概念漂移数据流半监督分类综述)[J].软件学报,2022(04):1287-1314
A类:
B类:
移数,半监督分类,分类综述,开放环境,速生,数据量,数据流分类,分类任务,训练数据,昂贵,不切实际,标记样本,无标记,注有,有监督,收集数据,分类研究,分类算法,分类器,概念漂移检测,真实数据,比较与分析,前概念,分类准确率,数据分布,变化关系,感兴趣,分类问题,集成学习
AB值:
0.228147
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。