首站-论文投稿智能助手
典型文献
融合注意力机制的铁路科技文献关键词抽取研究
文献摘要:
大数据时代,海量铁路科技文献的关键词抽取、知识组织成为铁路行业科技信息资源赋能领域科研创新、科技攻关的基础性工作.鉴于传统关键词抽取算法缺乏精准语义信息、准确率低等问题,提出Bi-TextRank算法以改进铁路科技文献关键词的抽取效果.Bi-TextRank算法由两阶段组成,第一阶段用融合注意力机制的Word2Vec模型对铁路科技文献中的词汇进行向量表征,进而优化TextRank节点间的转移概率,迭代计算筛选出候选关键词;第二阶段在候选关键词的基础上,基于词间语义关系构建新的网络图,并通过TextRank算法进行关键词二次筛选.以CNKI铁路运输文献数据为例进行实验,结果表明改进算法相较于传统TextRank算法准确率、召回率、平均值F分别增加了4.9%、3.4%、4.3%,并优于其他对比算法.
文献关键词:
铁路文献;关键词抽取;TextRank算法;Word2Vec模型;注意力机制
作者姓名:
李雪山;刘鹏鹏;李子林;赵占芳
作者机构:
中国铁道科学研究院集团有限公司 科学技术信息研究所,北京 100081;河北医科大学第一医院智慧医院建设部,河北 石家庄 050030;河北地质大学 信息工程学院,河北 石家庄 050031;河北省光电信息与地球探测技术重点实验室,河北 石家庄 050030
文献出处:
引用格式:
[1]李雪山;刘鹏鹏;李子林;赵占芳-.融合注意力机制的铁路科技文献关键词抽取研究)[J].铁道学报,2022(12):65-72
A类:
铁路文献
B类:
注意力机制,科技文献,关键词抽取,知识组织,织成,铁路行业,科技信息资源,资源赋能,科研创新,科技攻关,基础性工作,语义信息,Bi,TextRank,两阶段,第一阶段,Word2Vec,汇进,行向量,向量表征,转移概率,迭代计算,选关,第二阶段,语义关系,关系构建,网络图,二次筛选,铁路运输,文献数据,改进算法,召回率,对比算法
AB值:
0.398406
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。