典型文献
结合上下文词汇匹配和图卷积的材料数据命名实体识别
文献摘要:
材料领域的文献中蕴含着丰富的知识,利用机器学习和自然语言处理等手段对文献进行数据挖掘是研究热点.命名实体识别(named entity recognition,NER)是高效利用挖掘和抽取数据中信息的首要步骤.为了解决现有实体识别方法中存在的向量表示无法解决一词多义、模型常提取上下文特征而忽略全局特征等问题,提出了一种基于上下文词汇匹配和图卷积命名实体识别方法.该方法首先利用XLNet获取文本的上下文动态特征,其次利用长短期记忆网络并结合文本上下文匹配词汇的图卷积神经网络(graph convolutional network,GCN)模型分别获取上下文特征与全局特征,最终经过条件随机场输出标签序列.2种不同语料对模型进行验证的结果表明,该方法在材料数据集上的精确率、召回率和F1值分别达到90.05%、88.67%和89.36%,可有效提升命名实体识别的准确率.
文献关键词:
命名实体识别;XLNet;图卷积神经网络
中图分类号:
作者姓名:
陈茜;武星
作者机构:
上海大学计算机工程与科学学院,上海200444;上海大学材料基因组工程研究院材料信息与数据科学中心,上海200444;之江实验室,浙江杭州311100
文献出处:
引用格式:
[1]陈茜;武星-.结合上下文词汇匹配和图卷积的材料数据命名实体识别)[J].上海大学学报(自然科学版),2022(03):372-385
A类:
B类:
文词,命名实体识别,材料领域,自然语言处理,named,entity,recognition,NER,中信,实体识别方法,向量表示,一词多义,上下文特征,全局特征,XLNet,动态特征,长短期记忆网络,图卷积神经网络,graph,convolutional,network,GCN,条件随机场,语料,精确率,召回率
AB值:
0.241517
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。