典型文献
基于BERT改进的文化活动事件论元抽取研究
文献摘要:
目前对于事件抽取的研究主要还在使用ACE 2005的小规模开放域事件文本语料,而对事件抽取文本语料的标注需要大量专家经验和人力,昂贵且低效,事件抽取相关的语料类型较少,规模较少,不利于深度学习的应用.为解决这个问题,该文提出一种半监督的领域事件论元抽取方法,对源自全国各地图书馆官网的文化活动语料使用模板和领域字典匹配的方法进行自动标注,然后通过人工验证确保标注准确性,利用序列标注的方法进行事件论元抽取,并针对传统BiLSTM-CRF模型的词嵌入层无法解决一词多义的问题,提出在词嵌入层采用BERT模型和基于字位置信息的词向量扩展方法的改进.实验证明,该方法在事件论元抽取上F1值达到84.9%,优于传统的事件论元识别方法.
文献关键词:
自然语言处理;事件抽取;论元抽取;预训练模型;深度学习
中图分类号:
作者姓名:
蔺志;李原;王庆林
作者机构:
北京理工大学自动化学院,北京100081
文献出处:
引用格式:
[1]蔺志;李原;王庆林-.基于BERT改进的文化活动事件论元抽取研究)[J].中文信息学报,2022(12):115-122
A类:
语料使用,领域字典
B类:
BERT,文化活动,事件论元抽取,事件抽取,ACE,小规模,专家经验,昂贵,规模较,半监督,官网,自动标注,序列标注,行事,BiLSTM,CRF,词嵌入,嵌入层,一词多义,字位,位置信息,词向量,自然语言处理,预训练模型
AB值:
0.280733
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。