典型文献
一种基于关联数据的科技项目查重系统
文献摘要:
论文提出了一种基于关联数据的科技项目查重系统,通过整合与科技项目密切相关的项目任务书、科技论文、科技报告和科技成果等信息,建立科技项目的描述模型.采用改进的TextRank算法从摘要和标题等短文本中抽取关键词构建特征向量,并提出了项目相似度的判别方法.利用Hadoop和Spark的分布式计算框架,实现了项目查重系统并进行了相关的实验.结果证明了该方法的有效性和可行性,在给定的实验条件下取得了较高的准确率和召回率.
文献关键词:
关联数据;科技项目查重;数据挖掘;多源信息整合;Hadoop架构
中图分类号:
作者姓名:
李善青;安淑荻;邢晓昭
作者机构:
中国科学技术信息研究所 北京 100038
文献出处:
引用格式:
[1]李善青;安淑荻;邢晓昭-.一种基于关联数据的科技项目查重系统)[J].计算机与数字工程,2022(05):959-963
A类:
科技项目查重,多源信息整合
B类:
关联数据,查重系统,项目任务,任务书,科技论文,科技报告,科技成果,描述模型,TextRank,摘要,标题,短文本,特征向量,项目相似度,判别方法,Hadoop,Spark,分布式计算,计算框架,实验条件,召回率
AB值:
0.347595
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。