首站-论文投稿智能助手
典型文献
基于改进LDA模型的铁路领域主题发现研究
文献摘要:
高效挖掘海量铁路领域科研成果数据中蕴含的主要内容是铁路领域科研人员在大数据时代亟待解决的重要问题.L DA模型是用于主题发现的主流方法,但在面向多单词短语居多的铁路领域研究文献时存在使用受限的问题,因此本文提出一种L DA模型的改进算法:一方面在构建主题模型前,对文本作预处理时抽取语料中的名词短语、动词短语、名词和动词;另一方面在主题模型构建完成后,融合TextRank算法与PMI算法得出关键词组块,并以此替换L DA主题识别结果中的主题词,进一步丰富主题的语义.最后,以铁路领域"牵引供电系统"为例开展实证研究.结果表明,本文提出的改进L DA模型有助于提升铁路领域主题发现结果的可解释性与可识别性,可以为后续铁路领域科研管理中知识服务的实现提供有效的方法支持.
文献关键词:
主题发现;铁路领域;语义增强;LDA主题模型
作者姓名:
龙艺璇;安源;王东晋;翟夏普;伊惠芳
作者机构:
中国铁道科学研究院科学技术信息研究所,北京 100081;中国科学院文献情报中心,北京 100190
文献出处:
引用格式:
[1]龙艺璇;安源;王东晋;翟夏普;伊惠芳-.基于改进LDA模型的铁路领域主题发现研究)[J].数字图书馆论坛,2022(02):26-32
A类:
B类:
LDA,铁路领域,领域主题,主题发现,科研成果,科研人员,主流方法,单词,改进算法,主题模型,语料,名词短语,动词短语,TextRank,PMI,词组,组块,主题识别,主题词,牵引供电系统,可解释性,可识别性,科研管理,知识服务,语义增强
AB值:
0.328008
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。