典型文献
基于多元数据融合的科学文献主题识别研究
文献摘要:
[目的/意义]科学文献的主题识别研究是科研管理的重要内容之一,如何全面把握文献的多元数据、提升自动文献主题识别的效果是一个值得研究的问题.[方法/过程]文献的关键词、摘要是判断文献主题的重要依据,文章提出基于文献多元数据融合的主题识别模型,使用Word2vec模型、AP聚类及Node2vec模型表示出关键词层的主题向量,使用LDA模型表示出摘要层的主题向量,通过多视图聚类中的SGF方法进行数据融合并识别文献主题.[结果/结论]以不同规模的文献集为例,通过主题识别研究,验证该模型识别效果的准确性和可解释性优于典型LDA方法、Doc-LDA模型.
文献关键词:
科学文献;主题识别;数据融合;多视图聚类;多元数据
中图分类号:
作者姓名:
邱均平;孙月瑞;周贞云
作者机构:
杭州电子科技大学中国科教评价研究院 浙江 310018;杭州电子科技大学管理学院 浙江 310018;杭州电子科技大学数据科学与信息计量研究院 浙江 310018
文献出处:
引用格式:
[1]邱均平;孙月瑞;周贞云-.基于多元数据融合的科学文献主题识别研究)[J].情报资料工作,2022(06):14-20
A类:
B类:
多元数据融合,科学文献,文献主题,主题识别,科研管理,摘要,识别模型,Word2vec,AP,Node2vec,模型表示,主题向量,LDA,多视图聚类,SGF,不同规模,集为,模型识别,可解释性,Doc
AB值:
0.29629
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。