首站-论文投稿智能助手
典型文献
项目申请书摘要文本的语步识别语料构建
文献摘要:
[目的/意义]自动识别项目申请书摘要中的科学要素,对于揭示科技项目中的科学知识具有重要的研究意义.这些科学要素的识别依赖于结构化项目摘要文本,然而目前结构化项目摘要语料资源匮乏,严重制约着相关研究的进一步发展.拟构建项目申请书摘要文本的语步语料集,为相关研究提供数据支撑.[方法/过程]首先将项目摘要内容归纳为背景及问题、目标及任务、方法内容、价值意义4种语步类型,总结每个语步结构中出现的标志性特征并制定语步标注规范;其次相继利用基于规则和基于深度学习的方法辅助人工进行项目摘要的语步结构标注,并对每轮标注后的语料进行质量评估.[结果/结论]两种方法共计标注近25000条语句,语料标注的一致性系数达到0.9839,表明该语料集基本能够区分项目摘要内的不同语步结构,初步达到了语料库建设的基本要求.
文献关键词:
语步识别;项目申请摘要文本;语步语料集构建;迭代标注
作者姓名:
赵旸;张智雄;李婕
作者机构:
中国科学院文献情报中心 北京100190;中国科学院大学经济与管理学院图书情报与档案管理系 北京100190
文献出处:
引用格式:
[1]赵旸;张智雄;李婕-.项目申请书摘要文本的语步识别语料构建)[J].图书情报工作,2022(21):97-106
A类:
项目申请摘要文本,语步语料集构建,迭代标注
B类:
申请书,书摘,语步识别,自动识别,别项,科技项目,科学知识,研究意义,价值意义,语步结构,标志性特征,定语,标注规范,次相,基于规则,助人,工进,质量评估,法共,语句,语料标注,本能,分项,语料库建设
AB值:
0.271882
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。