典型文献
基于密度峰值优化K-means聚类算法的微博舆情分析
文献摘要:
通过自行开发的爬虫脚本,抓取新浪微博上不同的关键词组成文本数据集,对数据信息进行中文分词、去停用词、权重计算等预处理,然后利用改进的聚类算法对文本聚类分析.针对K-means算法存在随机选取的初始聚类中心导致后期易收敛不能保证全局最优的问题,提出改进的密度峰值算法优化的K-means聚类算法.实验结果表明,与传统的K-means算法相比较,改进后的算法聚类更加有效稳定,提高了微博舆情发现的准确度和效率.
文献关键词:
K-means算法;聚类中心;密度峰值;微博舆情
中图分类号:
作者姓名:
叶瑾玫;程科
作者机构:
江苏科技大学计算机学院 镇江 212003
文献出处:
引用格式:
[1]叶瑾玫;程科-.基于密度峰值优化K-means聚类算法的微博舆情分析)[J].计算机与数字工程,2022(04):726-729,735
A类:
改进的密度峰值算法,舆情发现
B类:
基于密度,means,聚类算法,微博舆情,舆情分析,爬虫,脚本,抓取,新浪微博,词组,成文,文本数据,中文分词,停用,用词,权重计算,文本聚类分析,初始聚类中心,全局最优,算法优化
AB值:
0.297811
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。