典型文献
基于事件抽取技术的听证公开文本挖掘方法研究
文献摘要:
[研究目的]为了帮助政府、企业和科研人员从海量的听证公开文本中发现科技相关政策和热点,快速、全面地识别出有价值的信息.[研究方法]梳理听证公开文本的类型与特点,并对其中有价值的信息进行合理的界定与分类;根据文本的内容特征和话语特征提出事件句识别、事件类型检测和事件论元抽取的三阶段式事件抽取方法,以实现有价值信息的抽取;对抽取的有价值信息进行深入分析.[研究结论]与基准模型相比,该研究所提方法在事件句识别召回率上提高33%,F1提高17%,在事件类型检测的精确率上提高1%,在事件论元抽取的精确率上提高18%,召回率提高4%,取得了一定效果,为此类文本进一步分析提供了新研究思路.
文献关键词:
信息抽取;事件抽取;听证公开文本;文本分析
中图分类号:
作者姓名:
丁思媛;乔晓东;张运良
作者机构:
中国科学技术信息研究所 北京 100038;富媒体数字出版内容组织与知识服务重点实验室 北京 100038;北京万方数据股份有限公司 北京 100038
文献出处:
引用格式:
[1]丁思媛;乔晓东;张运良-.基于事件抽取技术的听证公开文本挖掘方法研究)[J].情报杂志,2022(01):52-59,30
A类:
听证公开文本
B类:
事件抽取,文本挖掘,挖掘方法,研究目的,科研人员,类型与特点,内容特征,话语特征,出事,事件类型,类型检测,事件论元抽取,阶段式,价值信息,召回率,精确率,信息抽取
AB值:
0.274005
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。