典型文献
一种基于图挖掘的LDA改进算法
文献摘要:
LDA作为文本主题识别领域中使用最广泛的模型之一,其基于词袋模型的假设简单化地赋予词汇相同的权重,使得主题分布易向高频词倾斜,影响了识别主题的语义连贯性.本文针对该问题提出一种基于图挖掘的LDA改进算法GoW-LDA,首先基于特征词对在文本中的共现先后关系构建语义图模型,然后利用网络统计特征中节点的加权度,将文本的语义结构特点和关联性以权重修正的形式融入LDA主题建模中.实验结果显示,GoW-LDA相较于传统LDA和基于TF-IDF的LDA,能够大幅降低主题模型的混淆度,提高主题识别的互信息指数,并且有效减少模型的训练时间,为文本主题识别提供了一种新的解决思路.
文献关键词:
文本主题识别;图挖掘;潜在狄利克雷分布
中图分类号:
作者姓名:
李珊;陈妙苗;郑晨
作者机构:
南京航空航天大学经济与管理学院,江苏 南京 211106
文献出处:
引用格式:
[1]李珊;陈妙苗;郑晨-.一种基于图挖掘的LDA改进算法)[J].计算机与现代化,2022(07):61-66
A类:
GoW,语义图模型
B类:
图挖掘,LDA,改进算法,文本主题识别,词袋模型,简单化,得主,主题分布,高频词,语义连贯,连贯性,特征词,关系构建,利用网络,统计特征,中节点,语义结构,重修,主题建模,TF,IDF,主题模型,互信息,训练时间,解决思路,潜在狄利克雷分布
AB值:
0.350428
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。