典型文献
基于文本挖掘的科技文献主题演化研究进展
文献摘要:
[目的/意义]梳理国内外基于文本挖掘的科技文献主题演化相关研究,对主题演化分析中使用的各种方法进行分类、归纳与总结,并提出现有研究存在的不足,为主题演化研究提供新的思路与借鉴意义.[方法/过程]依照国内外学者进行主题演化研究的一般流程,对数据集选取与对象分析、主题识别研究、主题演化研究(主题演化时序分析、主题强度演化分析、主题内容演化分析)3个分析层面中所使用的各类模型、指标与方法进行梳理比较与优缺点总结,提出现有研究的局限性并对未来发展做出展望.[结果/结论]当前研究已具有一定规模和较为成熟的分析体系,但仍存在以下不足:数据来源较为单一;LDA及相关扩展模型存在的弊端需进一步克服;缺乏对其他机器学习及深度学习算法的探索应用;演化分析方法需相互结合、互补互融.未来应针对以上问题做出相应改进与深入探究.
文献关键词:
文本挖掘;主题模型;主题识别;主题演化
中图分类号:
作者姓名:
梁爽;刘小平
作者机构:
中国科学院文献情报中心 北京100190;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190
文献出处:
引用格式:
[1]梁爽;刘小平-.基于文本挖掘的科技文献主题演化研究进展)[J].图书情报工作,2022(13):138-149
A类:
B类:
文本挖掘,科技文献,文献主题,主题演化分析,一般流程,主题识别,时序分析,主题强度,强度演化,主题内容,出展,分析体系,数据来源,LDA,扩展模型,深度学习算法,探索应用,相互结合,主题模型
AB值:
0.329545
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。