首站-论文投稿智能助手
典型文献
一种面向中文的实体关系联合抽取方法研究
文献摘要:
从非结构化文本中提取实体、关系和属性组成的三元组信息,对于大规模知识图的构建至关重要.现有的研究通常以先实体识别后关系抽取或统一标注的方式完成这一任务.尽管这些方法使得信息抽取任务更易处理,且每个抽取模型的灵活性更高,但是它们忽略了实体识别和关系抽取两个任务之间的内在联系,且不能有效地解决同一句子中多个关系共享相同实体的三元组重叠问题.为了解决这些问题,本文构建了一个新的实体关系联合抽取模型,该模型包含头实体(Subject)抽取和与头实体相应的尾实体(Object)和关系(Relation)的抽取.首先,通过构建的BERT-BiLSTM-ATT模型识别句子中包含的所有头实体;其次,以头实体的BERT编码向量作为条件,通过构建的条件正则化(Conditional layer normalization,CLN)方法对编码序列做归一化处理;最后,通过构建的BiLSTM-ATT模型完成句子中关系和尾实体的识别.本文的新框架不再将关系视为离散的标签,而是将关系建模为头实体映射到句子中尾实体的函数,这有效解决了三元组重叠问题.在中文关系抽取数据集上,与存在的一些方法进行了性能比较,实验结果表明本文提出的实体关系抽取方法更加有效且稳定.
文献关键词:
三元组;实体识别;关系抽取;BERT;条件正则化
作者姓名:
李代祎;李忠良;严丽
作者机构:
南京航空航天大学计算机科学与技术学院,南京211106
引用格式:
[1]李代祎;李忠良;严丽-.一种面向中文的实体关系联合抽取方法研究)[J].小型微型计算机系统,2022(12):2479-2486
A类:
条件正则化
B类:
联合抽取方法,非结构化,结构化文本,常以,实体识别,别后,一任,信息抽取,一句,句子,三元组重叠,实体关系联合抽取模型,Subject,Object,Relation,BERT,BiLSTM,ATT,模型识别,别句,编码向量,Conditional,layer,normalization,CLN,编码序列,归一化处理,新框架,关系建模,体映射,射到,中尾,中文关系抽取,性能比较,实体关系抽取
AB值:
0.365612
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。