首站-论文投稿智能助手
典型文献
科技论文引用对象和引文功能的联合自动识别方法研究
文献摘要:
[目的/意义]国家强调重视科技成果的质量,科技成果的质量体现了科技成果的学术价值和贡献.科技论文是科技成果的重要载体之一.基于文本语义分析识别科技论文的引用对象和引文功能,对于科技论文的学术贡献和价值的评价具有重要的作用.[方法/过程]本文利用文本数据挖掘技术提出基于BERT-BiGRU-CRF的科技论文引用对象和引文功能的联合自动识别方法模型.首先从知网数据库获取科技论文全文本,利用正则匹配引用标记的方式获取科技论文引文内容;其次借鉴已有研究确定科技论文引用对象和引文功能标注方法,实现科技论文引文内容的人工标注;然后在预训练语言模型BERT的基础上结合BiGRU与CRF构建科技论文引文内容的序列标注模型,实现科技论文引用对象和引文功能的联合自动识别,将识别结果利用三元组进行表达;最后采用图情领域5本高质量期刊2021年上半年的科技论文文本数据进行实验.[结果/结论]实验结果表明,本文提出的方法模型在引用对象、引文功能和两者联合自动识别上的F1值分别为71.78%、68.33%、64.23%,均优于对比模型,初步验证了本文模型对于科技论文引用对象和引文功能自动识别的有效性.
文献关键词:
科技论文;价值评价;引用对象;引文功能;联合自动识别;BERT-BiGRU-CRF
作者姓名:
唐晓波;彭映寒
作者机构:
武汉大学信息系统研究中心,湖北 武汉430072;武汉大学信息管理学院,湖北 武汉430072
文献出处:
引用格式:
[1]唐晓波;彭映寒-.科技论文引用对象和引文功能的联合自动识别方法研究)[J].现代情报,2022(06):38-48
A类:
引用对象,引文功能,联合自动识别
B类:
科技论文,自动识别方法,调重,科技成果,学术价值,文本语义分析,分析识别,别科,学术贡献,文本数据挖掘,数据挖掘技术,BERT,BiGRU,CRF,方法模型,知网数据库,全文本,正则,引文内容,标注方法,预训练语言模型,序列标注,三元组,图情领域,上半年,对比模型,价值评价
AB值:
0.202752
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。