首站-论文投稿智能助手
典型文献
基于深度学习与需求规则融合的学术文献"目标数据"抽取模型构建与应用——以南海数字资源为例
文献摘要:
[目的 /意义]从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务.[方法/过程]根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中抽取目标数据.其次使用NER和TF-IDF抽取目标数据的"5W"规则,接着对目标数据做第二层需求规则过滤,凡是满足"5W"规则的数据,被鉴定为目标数据.最后对目标数据做第三层人工校验,最终生成学术文献"目标数据".[结果/结论]本文构建的学术文献"目标数据"抽取模型的准确率可达0.88,再融合"5W"规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献数据库机构的检索工作.[创新/局限]深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息层面到进入学术文献内容的数据层面.
文献关键词:
深度学习;命名实体识别;词袋模型;TF-IDF;"5W"规则
作者姓名:
彭玉芳;陈将浩
作者机构:
南京工程学院经济与管理学院,江苏南京211167;南京大学信息管理学院,江苏南京210046;中国科学技术大学数学科学学院,安徽合肥230026
文献出处:
引用格式:
[1]彭玉芳;陈将浩-.基于深度学习与需求规则融合的学术文献"目标数据"抽取模型构建与应用——以南海数字资源为例)[J].情报科学,2022(01):141-147,157
A类:
B类:
学术文献,取模,模型构建与应用,南海,数字资源,科研人员,提高研究,科研效率,改善目前,前文,文献数据库,检索服务,学术需求,深度学习方法,NER,TF,IDF,5W,第二层,凡是,第三层,校验,终生,再融合,科研工作,查准率,数据库机,题录,数据层,命名实体识别,词袋模型
AB值:
0.400036
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。