首站-论文投稿智能助手
典型文献
基于随机森林的Science和Nature期刊潜在精品论文识别研究
文献摘要:
[目的/意义]为推动潜在"精品"文献识别及其在科技文献识别与传播利用领域中的应用.[方法/过程]以国际顶级期刊Science和Nature期刊出版的论文及其引用分布数据为样本,统计出全部论文的首次响应时间、摘要长度,总被引频次、资金资助、论文篇幅等特征,构建"精品"论文特征矩阵;然后基于"精品"论文特征矩阵和随机森林算法进行潜在"精品"论文识别模型的训练与识别应用.[结果/结论]研究结果显示,融合"精品"论文特征矩阵和随机森林模型能够较好地识别Science和Nature期刊中的潜在"精品"论文,模型正确识别分类的准确率均值达到80%以上,其中Nature期刊的"精品"文献识别准确率高出Science期刊的"精品"论文识别准确率2%左右;使用信息增益方法的模型识别效果比使用基尼不纯度方法的识别效果略好.此外,Science和Nature期刊"精品"论文的首次被引速度极快,在出版当年即被引用.[创新/局限]"精品"文献特征矩阵和机器学习模型的结合能够较好地应用于潜在"精品"论文的识别与推荐,然而未来需将模型推广应用于海量文献中"精品"论文的识别检验.
文献关键词:
随机森林;识别模型;潜在精品;高被引;首次被引;科学计量
作者姓名:
胡泽文;任萍;周西姬
作者机构:
南京信息工程大学管理工程学院,江苏南京 210044
文献出处:
引用格式:
[1]胡泽文;任萍;周西姬-.基于随机森林的Science和Nature期刊潜在精品论文识别研究)[J].情报科学,2022(04):90-95,106
A类:
潜在精品,被引速度
B类:
Nature,品论,科技文献,传播利用,顶级期刊,期刊出版,响应时间,摘要,总被引频次,篇幅,论文特征,特征矩阵,矩阵和,随机森林算法,识别模型,随机森林模型,识别分类,识别准确率,信息增益,模型识别,基尼,不纯,首次被引,极快,文献特征,机器学习模型,结合能,需将,高被引,科学计量
AB值:
0.340047
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。