典型文献
基于候选中心融合的多观测点I-nice聚类算法
文献摘要:
伴随着问题场景数据在规模上的快速增长和构成上的复杂化,精确估计簇的个数和簇的中心点是当下聚类算法处理和分析复杂大规模数据的重要挑战.簇数及簇心的精确估计对于部分有参聚类算法、数据集整体复杂性度量和数据简化表示等都十分关键.文中在深入分析I-nice的基础上,提出基于候选中心融合的多观测点I-nice聚类算法.在原多观测点投影分治框架上采用混合高斯模型(Gaussian Mixture Model,GMM),结合粗细粒度最佳GMM搜索策略,实现数据子集的精确划分.此外,基于候选中心点分别到各观测点的距离值及最佳GMM,构造候选中心点的GMM构件向量,并设计一组闵可夫斯基距离对进行候选中心点间的相异度度量,实现基于GMM构件向量相异度的多观测点I-nice候选中心融合.不同于现有聚类算法,文中算法联合优化分治环节数据子集划分和候选中心集成这两个关键过程,实现成百上千个簇的精确高效估计.在真实数据集和仿真数据集上的一系列实验表明,文中算法能精确估计簇数和簇中心,具备较高的聚类精度.实验同时验证算法的有效性及在各类数据场景下的稳定性.
文献关键词:
无监督学习;观测点;I-nice;无参聚类;高斯混合模型
中图分类号:
作者姓名:
陈鸿杰;何玉林;黄哲学;尹剑飞
作者机构:
深圳大学计算机与软件学院大数据技术与应用研究所 深圳518060;深圳大学 大数据系统计算技术国家工程实验室 深圳518060
文献出处:
引用格式:
[1]陈鸿杰;何玉林;黄哲学;尹剑飞-.基于候选中心融合的多观测点I-nice聚类算法)[J].模式识别与人工智能,2022(04):348-362
A类:
无参聚类
B类:
选中,观测点,nice,聚类算法,问题场景,精确估计,中心点,大规模数据,复杂性度量,分治,架上,混合高斯模型,Gaussian,Mixture,Model,GMM,粗细,细粒度,搜索策略,子集,闵可夫斯基距离,相异度,度度,联合优化,节数,关键过程,现成,成百上千,千个,真实数据,仿真数据,系列实验,簇中心,聚类精度,数据场,无监督学习,高斯混合模型
AB值:
0.337837
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。