首站-论文投稿智能助手
典型文献
基于先精确后召回策略的作者名消歧模型研究
文献摘要:
学者完整且准确的学术成果集为科学计量与科研人才评价等研究提供了重要的数据基础.在现有基于机器学习模型的作者姓名消歧方法尚未达到实用要求的背景下,本研究面向高层次科研人才,充分利用基于规则方法精确率高的优势,提出了"先面向精确率,后面向召回率"的"两步法"作者姓名消歧模型.得益于该群体易于从网络中搜集其履历、研究方向和代表作等信息,消歧模型可采用的特征更加丰富,从而保证了消歧模型的优异性能.本研究以国家杰出青年科学基金获得者为例对模型进行了验证,结果表明,本研究提出的高层次科研人才作者名消歧模型在精确率与召回率两个方面均表现良好,在两组不同特征集上的F1值分别达到了0.93和0.95,较基线模型有较大提升.
文献关键词:
作者名消歧;规则消歧;高层次科研人才;两步法
作者姓名:
沈喆;王毅;鞠秀芳;成颖
作者机构:
南京大学信息管理学院,南京 210023;南京大学中国社会科学研究评价中心,南京 210093
文献出处:
引用格式:
[1]沈喆;王毅;鞠秀芳;成颖-.基于先精确后召回策略的作者名消歧模型研究)[J].情报学报,2022(04):350-363
A类:
作者名消歧,高层次科研人才,规则消歧
B类:
召回策略,学术成果,集为,科学计量,科研人才评价,数据基础,基于机器学习,机器学习模型,作者姓名消歧,基于规则,精确率,后面,召回率,两步法,履历,代表作,优异性能,杰出青年,青年科学基金,获得者,征集,基线模型
AB值:
0.237963
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。