首站-论文投稿智能助手
典型文献
加权K近邻和多簇合并的密度峰值聚类算法
文献摘要:
密度峰值聚类(DPC)算法是一种基于密度的聚类算法.该算法原理简单、运行高效,可以找到任意非球形类簇.但是该算法存在一些缺陷:首先,该算法局部密度定义的度量准则不统一且两者的聚类结果存在较大差异;其次,该算法的分配策略易产生分配连带错误,即一旦某一个样本分配错误,会导致后续一连串的样本分配错误.为解决这些问题,提出了一种加权K近邻和多簇合并的密度峰值聚类算法(WKMM-DPC).该算法结合加权K近邻的思想,引入样本的权重系数,重新定义样本的局部密度,使局部密度更加依赖于K近邻内样本的位置,且统一了密度定义的度量准则;定义了类簇间的相似度,并据此度量准则进行多簇合并,以避免分配剩余样本时的分配连带错误.在人工和UCI数据集上的实验表明,该算法的聚类效果优于FKNN-DPC、DPCSA、FNDPC、DPC和DBSCAN算法.
文献关键词:
聚类;局部密度;密度峰值;K近邻(KNN);多簇合并
作者姓名:
陈磊;吴润秀;李沛武;赵嘉
作者机构:
南昌工程学院 信息工程学院,南昌 330099
引用格式:
[1]陈磊;吴润秀;李沛武;赵嘉-.加权K近邻和多簇合并的密度峰值聚类算法)[J].计算机科学与探索,2022(09):2163-2176
A类:
多簇合并,WKMM,DPCSA,FNDPC
B类:
近邻,密度峰值聚类算法,基于密度的聚类算法,算法原理,到任,局部密度,度量准则,分配策略,连带,一个样,一连串,权重系数,重新定义,UCI,FKNN,DBSCAN
AB值:
0.188046
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。