典型文献
基于CWHC-AM的实体及关系联合抽取方法
文献摘要:
实体及关系抽取是从非结构化自然语言文本中抽取三元组.传统流水线的方法先抽取实体再抽取关系,容易造成误差传播,也忽略了两个子任务的内在联系和依赖关系,抽取多元关系及重叠关系效果较差.针对上述问题,该文首先将多元关系问题转换成多个二元关系问题进行抽取,充分考虑两个子任务之间的联系,提出一种基于CWHC-AM(character word hybrid coding and attention mechanism)的实体及关系联合抽取模型,采用多层指针网络标注方案,将实体及关系联合抽取任务转化为序列标注问题,实现重叠关系抽取.最后,引入对抗训练提高模型的鲁棒性.在百度DuIE 2.0中文数据集上进行实验,结果表明该文方法可有效地同时抽取多元关系及二元关系,取得比基线模型都要好的效果.
文献关键词:
关系抽取;联合抽取;多元关系;对抗训练
中图分类号:
作者姓名:
李宏宇;段利国;候晨蕾;姚龙飞
作者机构:
太原理工大学 信息与计算机学院,山西 太原 030024;山西师范大学现代文理学院 转改筹备处,山西 临汾 041000
文献出处:
引用格式:
[1]李宏宇;段利国;候晨蕾;姚龙飞-.基于CWHC-AM的实体及关系联合抽取方法)[J].中文信息学报,2022(11):79-90
A类:
CWHC
B类:
AM,联合抽取方法,关系抽取,非结构化,自然语言,三元组,流水线,先抽,误差传播,子任务,依赖关系,多元关系,问题转换,转换成,二元关系,character,word,hybrid,coding,attention,mechanism,联合抽取模型,指针网络,序列标注,对抗训练,百度,DuIE,中文数据集,比基,基线模型
AB值:
0.405441
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。