典型文献
基于语义关联与模糊聚类的共词分析方法
文献摘要:
共词分析是文本内容分析的重要基础方法,但已有共词分析方法存在两方面不足,一是在关键词共词矩阵构建中未考虑词对的语义关联,二是在共词矩阵聚类分析中不支持词汇主题归属的多元性.本文提出基于语义关联与模糊聚类的共词分析方法,结合高频低频词界分公式和词频g指数抽取领域关键词,利用词嵌入模型学习关键词的语义向量表示,进而构建语义加权共词矩阵,以综合共现特征与语义关联来度量词对间相关性;结合模糊C均值聚类算法与因子降维对语义加权共词矩阵进行关键词模糊聚类,以弥补硬聚类中词汇主题归属单一化的不足,提高类团的信息质量并揭示类团之间的联系.选择"感染性疾病学和传染病学类"期刊文献开展实验,结果验证了本文方法的有效性和优越性.
文献关键词:
共词分析;语义关联;词嵌入模型;模糊C均值聚类
中图分类号:
作者姓名:
陆泉;曹越;陈静
作者机构:
武汉大学信息资源研究中心,武汉 430072;武汉大学大数据研究院,武汉 430072;华中师范大学信息管理学院,武汉 430079
文献出处:
引用格式:
[1]陆泉;曹越;陈静-.基于语义关联与模糊聚类的共词分析方法)[J].情报学报,2022(10):1003-1014
A类:
B类:
语义关联,模糊聚类,共词分析,文本内容分析,共词矩阵,不支,多元性,低频词,界分,词频,用词,词嵌入模型,模型学习,向量表示,合共,量词,均值聚类,聚类算法,中词,单一化,信息质量,感染性疾病,传染病学,期刊文献
AB值:
0.316648
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。