首站-论文投稿智能助手
典型文献
改进CK-means+算法及并行实现
文献摘要:
为降低K值的不确定性和初始聚类中心的随机性对聚类结果的影响,提出一种基于优化Canopy算法和均值计算法的改进K-means算法——CK-means+.优化Canopy算法,降低距离阈值T不确定性对最终输出K值的影响,通过Canopy算法和均值计算法得到K值和初始中心点.在UCI数据集上,结合Spark框架并行化,实验结果表明,相较其它算法,CK-means+算法效率更高,可以更好适应大规模数据应用场景.
文献关键词:
Canopy算法;K-means算法;初始值K;初始中心点;并行化
作者姓名:
邵金鑫;行艳妮;南方哲;赵鑫;马廷淮;钱育蓉
作者机构:
新疆大学 软件学院 新疆维吾尔自治区信号检测与处理重点实验室,新疆 乌鲁木齐 830046;南京信息工程大学 国际教育学院,江苏 南京 210044
引用格式:
[1]邵金鑫;行艳妮;南方哲;赵鑫;马廷淮;钱育蓉-.改进CK-means+算法及并行实现)[J].计算机工程与设计,2022(05):1240-1248
A类:
means+
B类:
初始聚类中心,随机性,Canopy,均值计算,计算法,距离阈值,初始中心点,UCI,Spark,并行化,算法效率,大规模数据,数据应用场景,初始值
AB值:
0.323364
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。