典型文献
基于边界点检测的变密度聚类算法
文献摘要:
密度聚类算法因具有对噪声鲁棒、能够发现任意形状的类等优点,得到了广泛的应用.然而,在实际应用中,这种算法面临着由于数据集中不同类的密度分布不均,且类与类之间的边界难以区分等导致聚类效果较差的问题.为解决以上问题,提出一种基于边界点检测的变密度聚类算法(VDCBD).首先,基于给出的相对密度度量方法识别变密度类之间的边界点,以此增强相邻类的可分性;其次,对非边界区域的点进行聚类以找到数据集的核心类结构;接着,依据高密度近邻分配原则将检测到的边界点分配到相应的核心类结构中;最后,基于类结构信息识别数据集中的噪声点.在人造数据集和UCI数据集上与K-means、基于密度的噪声应用空间聚类(DBSCAN)算法、密度峰值聚类算法(DPCA)、有效识别密度主干的聚类(CLUB)算法、边界剥离聚类(BP)算法进行了比较分析.实验结果表明,所提算法可以有效解决类分布密度不均、边界难以区分的问题,并在调整兰德指数(ARI)、标准化互信息(NMI)、F度量(FM)、准确度(ACC)评价指标上优于已有算法;在运行效率分析中,当数据规模较大时,VDCBD运行效率高于DPCA、CLUB和BP算法.
文献关键词:
密度聚类;相对密度;变密度;边界点检测;噪声识别
中图分类号:
作者姓名:
陈延伟;赵兴旺
作者机构:
山西大学计算机与信息技术学院,太原030006;计算智能与中文信息处理教育部重点实验室(山西大学),太原030006
文献出处:
引用格式:
[1]陈延伟;赵兴旺-.基于边界点检测的变密度聚类算法)[J].计算机应用,2022(08):2450-2460
A类:
VDCBD
B类:
边界点检测,变密度,密度聚类算法,法因,对噪声鲁棒,现任,任意形状,密度分布,相对密度,度度,方法识别,增强相,邻类,可分性,近邻,分配原则,配到,结构信息,信息识别,别数,噪声点,人造,UCI,means,基于密度的噪声应用空间聚类,DBSCAN,密度峰值聚类算法,DPCA,CLUB,离聚,分布密度,兰德,ARI,互信息,NMI,FM,ACC,效率分析,规模较,噪声识别
AB值:
0.379199
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。