典型文献
基于无监督的热点话题发现研究
文献摘要:
高校"百度贴吧"经常会有用户发表一些讨论帖,这些信息对于学校来说是非常有用的.但是未经处理的信息无法实时给当局者提供帮助.因此,文章提出一种利用自然语言处理方法获取"贴吧"信息,并实时发现热点话题的方法.本文首先获取网络文本信息,对文本进行预处理,包括分词、去除停用词,再计算文本的TF-IDF值,最后利用无监督学习方法(K-means)对文本进行聚类,从而获取热点话题.从实验结果中可以看出,本方法可以有效地发现"贴吧"中的热点话题.
文献关键词:
自然语言处理;热点话题;机器学习;K-means
中图分类号:
作者姓名:
闻彬;熊飞;陈薇
作者机构:
湖北轻工职业技术学院信息工程学院,湖北武汉430070;光谷第十一小学,湖北武汉430070;华西证券股份有限公司,四川成都610095
文献出处:
引用格式:
[1]闻彬;熊飞;陈薇-.基于无监督的热点话题发现研究)[J].电脑知识与技术,2022(35):16-18
A类:
热点话题发现
B类:
百度贴吧,当局者,自然语言处理,网络文本,文本信息,分词,停用,用词,TF,IDF,无监督学习,means
AB值:
0.280421
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。