典型文献
                一种基于图挖掘的LDA改进算法
            文献摘要:
                    LDA作为文本主题识别领域中使用最广泛的模型之一,其基于词袋模型的假设简单化地赋予词汇相同的权重,使得主题分布易向高频词倾斜,影响了识别主题的语义连贯性.本文针对该问题提出一种基于图挖掘的LDA改进算法GoW-LDA,首先基于特征词对在文本中的共现先后关系构建语义图模型,然后利用网络统计特征中节点的加权度,将文本的语义结构特点和关联性以权重修正的形式融入LDA主题建模中.实验结果显示,GoW-LDA相较于传统LDA和基于TF-IDF的LDA,能够大幅降低主题模型的混淆度,提高主题识别的互信息指数,并且有效减少模型的训练时间,为文本主题识别提供了一种新的解决思路.
                文献关键词:
                    文本主题识别;图挖掘;潜在狄利克雷分布
                中图分类号:
                    
                作者姓名:
                    
                        李珊;陈妙苗;郑晨
                    
                作者机构:
                    南京航空航天大学经济与管理学院,江苏 南京 211106
                文献出处:
                    
                引用格式:
                    
                        [1]李珊;陈妙苗;郑晨-.一种基于图挖掘的LDA改进算法)[J].计算机与现代化,2022(07):61-66
                    
                A类:
                GoW,语义图模型
                B类:
                    图挖掘,LDA,改进算法,文本主题识别,词袋模型,简单化,得主,主题分布,高频词,语义连贯,连贯性,特征词,关系构建,利用网络,统计特征,中节点,语义结构,重修,主题建模,TF,IDF,主题模型,互信息,训练时间,解决思路,潜在狄利克雷分布
                AB值:
                    0.350428
                相似文献
                
            机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。