典型文献
基于词典与字向量融合的井控领域命名实体识别
文献摘要:
为了解决面向井控领域的命名实体识别容易受分词信息的影响以及在特征提取过程中忽略部分局部特征的问题,提出一种基于词典与字向量融合的CW-NER实体识别模型.该方法首先利用井控领域词典对语料进行分词、标注,映射为低维向量,与经过特征提取后的字向量进行拼接融合,获得更丰富的词向量表示;其次将词向量分别输入双向长短时记忆网络(BiLSTM)与膨胀卷积神经网络模型(IDCNN)中提取特征,并将输出特征合并,利用多头自注意力机制(Multi-headed Self-attention)来捕获向量间的权重等信息;最后,经过条件随机场(CRF)对结果进行修正后输出.为验证方法的有效性,在井控领域语料集上进行了多组对比实验,实验结果表明,本文提出的命名实体识别模型均优于其他传统模型,其识别的准确率、召回率和F1值分别达到了 91.31%,87.03%,89.04%.
文献关键词:
命名实体识;井控领域;双向长短时记忆网络;膨胀卷积神经网络;多头自注意力机制
中图分类号:
作者姓名:
吴雅娟;牛甲奎;解红涛;马宁
作者机构:
东北石油大学计算机与信息技术学院,黑龙江大庆,163318
文献出处:
引用格式:
[1]吴雅娟;牛甲奎;解红涛;马宁-.基于词典与字向量融合的井控领域命名实体识别)[J].海南大学学报(自然科学版),2022(02):125-133
A类:
井控领域
B类:
字向量,向量融合,命名实体识别,分词,词信息,分局,局部特征,CW,NER,识别模型,领域词典,语料,低维,拼接,词向量,向量表示,别输,双向长短时记忆网络,BiLSTM,膨胀卷积神经网络,卷积神经网络模型,IDCNN,提取特征,特征合并,多头自注意力机制,Multi,headed,Self,attention,条件随机场,CRF,验证方法,传统模型,召回率
AB值:
0.26631
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。