典型文献
基于自编码器与集成学习的离群点检测算法
文献摘要:
针对基于自编码器的离群点检测算法在中小规模数据集上易过拟合以及传统的基于集成学习的离群点检测算法未对基检测器进行优化选择而导致的检测精度低的问题,提出了一种基于自编码器与集成学习的离群点检测(EAOD)算法.首先,随机改变自编码器的连接结构来生成不同的基检测器,以获取数据对象的离群值和标签离群值;然后,通过最近邻算法计算数据对象之间的欧氏距离,并在对象周围构建局部区域;最后,根据离群值与标签离群值之间的相似度,选择在该区域内检测能力强的基检测器进行组合,组合后的对象离群值作为EAOD算法最终判定的离群值.在实验中,所提算法与自编码器(AE)算法相比,在Cardio数据集上,接受者操作特征曲线下方的面积(AUC)和平均精度(AP)分值分别提高了8.08个百分点和9.17个百分点;所提算法与特征装袋(FB)集成学习算法相比,在Mnist数据集上,运行时间成本降低了21.33%.实验结果表明,在无监督学习下所提算法具有良好的检测性能和检测实时性.
文献关键词:
离群点检测;集成学习;自编码器;基检测器;无监督学习
中图分类号:
作者姓名:
郭一阳;于炯;杜旭升;杨少智;曹铭
作者机构:
新疆大学信息科学与工程学院,乌鲁木齐830046;新疆大学软件学院,乌鲁木齐830091;中国海洋大学信息科学与工程学院,山东青岛266100
文献出处:
引用格式:
[1]郭一阳;于炯;杜旭升;杨少智;曹铭-.基于自编码器与集成学习的离群点检测算法)[J].计算机应用,2022(07):2078-2087
A类:
基检测器,EAOD
B类:
自编码器,离群点检测,检测算法,中小规模,小规模数据集,过拟合,优化选择,检测精度,连接结构,来生,获取数据,数据对象,离群值,最近邻算法,算法计算,算数,欧氏距离,局部区域,内检测,检测能力,AE,Cardio,接受者,操作特征,AP,百分点,装袋,FB,集成学习算法,Mnist,运行时间,时间成本,成本降低,无监督学习,检测性能
AB值:
0.23902
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。