典型文献
融合多语义特征的命名实体识别方法
文献摘要:
针对语言普遍存在的字符间非线性关系,为捕获更丰富的语义特征,提出了一种基于图卷积神经网络(GCN)和自注意力机制的命名实体识别(NER)方法.首先,借助深度学习方法有效提取字符特征的能力,采用GCN学习字符间的全局语义特征,并且采用双向长短时记忆网络(BiLSTM)提取字符的上下文依赖特征;其次,融合以上特征并引入自注意力机制计算其内部重要度;最后,使用条件随机场(CRF)从融合特征中解码出最优的编码序列,并以此作为实体识别的结果.实验结果表明,与单一采用BiLSTM和CRF的方法相比,所提方法在微软亚洲研究院(MSRA)数据集和BioNLP/NLPBA 2004数据集上的精确率分别至少提高了2.39%和15.2%.可见该方法在中文和英文数据集上都具备良好的序列标注能力,且泛化能力较强.
文献关键词:
命名实体识别;序列标注;自注意力机制;图卷积网络;双向长短时记忆网络
中图分类号:
作者姓名:
左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤
作者机构:
广东工业大学计算机学院,广州510006
文献出处:
引用格式:
[1]左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤-.融合多语义特征的命名实体识别方法)[J].计算机应用,2022(07):2001-2008
A类:
BioNLP,NLPBA
B类:
多语,语义特征,命名实体识别,实体识别方法,字符,非线性关系,图卷积神经网络,GCN,自注意力机制,NER,深度学习方法,有效提取,取字,习字,全局语义,双向长短时记忆网络,BiLSTM,上下文依赖,赖特,重要度,使用条件,条件随机场,CRF,融合特征,解码,编码序列,微软,亚洲研究,MSRA,精确率,少提,文和,序列标注,泛化能力,图卷积网络
AB值:
0.316931
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。