典型文献
面向高维特征缺失数据的K最近邻插补子空间聚类算法
文献摘要:
针对高维特征缺失数据在聚类过程中面临的因数据高维引发的维度灾难问题和数据特征缺失导致的样本间有效距离计算失效问题,提出一种面向高维特征缺失数据的K最近邻(KNN)插补子空间聚类算法KISC.首先,利用高维特征缺失数据的子空间下的近邻关系对原始空间下的特征缺失数据进行KNN插补;然后,利用多次迭代矩阵分解和KNN插补获得数据最终可靠的子空间结构,并在该子空间结构进行聚类分析.在6个图像数据集原始空间的聚类结果表明,相较于经过插补后直接进行聚类的对比算法,KISC算法聚类效果更好,说明子空间结构能够更加容易且有效地识别数据的潜在聚类结构;在6个高维数据集子空间下的聚类结果显示,KISC算法在各个数据集的聚类性能均优于对比算法,且在大多数据集上取得了最优的聚类精确度(ACC)和标准互信息(NMI).KISC算法能够更加有效地处理高维特征缺失数据,提高算法的聚类性能.
文献关键词:
高维数据;特征缺失;插补算法;子空间结构;聚类
中图分类号:
作者姓名:
乔永坚;刘晓琳;白亮
作者机构:
山西大学 计算机与信息技术学院,太原 030006;计算智能与中文信息处理教育部重点实验室(山西大学),太原 030006
文献出处:
引用格式:
[1]乔永坚;刘晓琳;白亮-.面向高维特征缺失数据的K最近邻插补子空间聚类算法)[J].计算机应用,2022(11):3322-3329
A类:
KISC
B类:
高维特征,特征缺失,缺失数据,最近邻,子空间聚类,聚类算法,维度灾难,数据特征,有效距离,距离计算,KNN,近邻关系,多次迭代,矩阵分解,得数,子空间结构,图像数据集,接进,对比算法,明子,别数,聚类结构,高维数据,集子,聚类精确度,ACC,互信息,NMI,插补算法
AB值:
0.275892
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。