首站-论文投稿智能助手
典型文献
融合LDA和GloVe模型的病症文本聚类算法
文献摘要:
针对隐含狄利克雷分布(LDA)模型特征提取时忽略语义信息的问题,提出一种融合LDA和全局文本表示(GloVe)模型的病症文本聚类算法LG&K-Medoide.首先,利用LDA对病症文本数据建模,采用JS(Jensen-Shannon)距离计算文本相似度;其次,利用GloVe对病症文本数据建模获取词向量,根据病症词性贡献度,对词向量权重进行标注,采用余弦距离计算基于GloVe建模加权的文本相似度;最后,将两种相似度进行结合,改进距离公式,实现K-Medoide聚类.实验结果表明,LG&K-Medoide算法较基于LDA,LDA+TF-IDF,LDA+Word2Vec模型的聚类算法具有较高的精度.
文献关键词:
病症文本;LDA;GloVe;相似度结合;聚类
作者姓名:
吴迪;赵玉凤
作者机构:
河北工程大学 信息与电气工程学院,河北 邯郸056038
引用格式:
[1]吴迪;赵玉凤-.融合LDA和GloVe模型的病症文本聚类算法)[J].河北工程大学学报(自然科学版),2022(01):92-98
A类:
病症文本,Medoide,LDA+TF,LDA+Word2Vec
B类:
GloVe,文本聚类,聚类算法,隐含狄利克雷分布,模型特征,略语,语义信息,文本表示,LG,文本数据,数据建模,JS,Jensen,Shannon,距离计算,文本相似度,取词,词向量,词性,贡献度,余弦距离,距离公式,IDF,相似度结合
AB值:
0.294933
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。