首站-论文投稿智能助手
典型文献
基于词嵌入特性聚类的文本主题挖掘
文献摘要:
数据聚类是常用的无监督学习方法,通过词嵌入聚类能够挖掘文本主题,但现有研究大多数采用常规聚类算法挖掘词嵌入的簇类,缺少基于词嵌入特性设计实现词嵌入聚类的主题挖掘算法.该文从语言模型通过建模词间相关信息来使相关及语义相似词的嵌入表示聚集在一起的特点出发,设计词嵌入聚类算法.该算法首先计算中心词的簇类号,然后使该簇中心嵌入和相邻词嵌入的相似性增强,同时使其与负样本词嵌入远离,学习文本集词嵌入的簇类结构,并将其应用于文本主题挖掘.在3种公开数据集上的实验表明:该算法在一些模型的词嵌入结果上能够挖掘出一致性和多样性更好的主题结果.
文献关键词:
词嵌入;聚类;语言模型;文本主题
作者姓名:
曹中华;黄欣;彭文忠;刘媛春
作者机构:
江西师范大学软件学院,江西南昌 330022;江西财经大学信息管理学院,江西南昌 330032
引用格式:
[1]曹中华;黄欣;彭文忠;刘媛春-.基于词嵌入特性聚类的文本主题挖掘)[J].江西师范大学学报(自然科学版),2022(05):468-474
A类:
B类:
词嵌入,文本主题挖掘,数据聚类,无监督学习,聚类算法,设计实现,挖掘算法,语言模型,语义相似,嵌入表示,计算中心,中心词,簇中心,学习文本,公开数据集,挖掘出
AB值:
0.271688
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。