首站-论文投稿智能助手
典型文献
基于BERT的多特征融合农业命名实体识别
文献摘要:
命名实体识别是农业文本信息抽取的重要环节,针对实体识别过程中局部上下文特征缺失、字向量表征单一、罕见实体识别率低等问题,提出一种融合BERT(Bidirectional Encoder Representations from Transformers,转换器的双向编码器表征量)字级特征与外部词典特征的命名实体识别方法.通过BERT预训练模型,融合左右两侧语境信息,增强字的语义表示,缓解一词多义的问题;自建农业领域词典,引入双向最大匹配策略,获取分布式词典特征表示,提高模型对罕见或未知实体的识别准确率;利用双向长短时记忆(Bi-directional Long-short Term Memory,BiLSTM)网络获取序列特征矩阵,并通过条件随机场(Conditional Random Field,CRF)模型生成全局最优序列.结合领域专家知识,构建农业语料集,包含5295条标注语料,5类农业实体.模型在语料集上准确率为94.84%、召回率为95.23%、F1值为95.03%.研究结果表明,该方法能够有效识别农业领域命名实体,识别精准度优于其他模型,具有明显的优势.
文献关键词:
农业;命名实体识别;文本;BERT;词典特征;BiLSTM
作者姓名:
赵鹏飞;赵春江;吴华瑞;王维
作者机构:
山西农业大学工学院,太谷 030801;国家农业信息化工程技术研究中心,北京 100097;北京农业信息技术研究中心,北京 100097;北京农业智能装备技术研究中心,北京 100097
文献出处:
引用格式:
[1]赵鹏飞;赵春江;吴华瑞;王维-.基于BERT的多特征融合农业命名实体识别)[J].农业工程学报,2022(03):112-118
A类:
B类:
BERT,多特征融合,命名实体识别,农业文本,文本信息抽取,识别过程,中局,局部上下文特征,特征缺失,字向量,向量表征,识别率,Bidirectional,Encoder,Representations,from,Transformers,转换器,双向编码器,词典特征,实体识别方法,预训练模型,左右两,一词多义,农业领域,领域词典,最大匹配,匹配策略,取分,特征表示,识别准确率,双向长短时记忆,Long,short,Term,Memory,BiLSTM,序列特征,特征矩阵,条件随机场,Conditional,Random,Field,CRF,模型生成,全局最优,最优序列,合领,领域专家,专家知识,语料,召回率
AB值:
0.425624
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。