典型文献
基于预训练模型的军事领域命名实体识别研究
文献摘要:
[目的]为了解决开源非结构化军事领域数据的命名实体识别问题.[方法]本文提出基于预训练模型(Bidirectional Encoder Representations from Transformers,BERT)的命名实体识别方法,首先基于预训练BERT模型生成自建开源军事语料的动态特征词向量的字符表示,然后基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)完成语义特征提取,最后利用条件随机场模型(Conditional Random Fields,CRF)选出最优标签序列完成实体识别的任务.[结果]模型在自建的开源军事数据集上的实验结果表明,相较于基于统计模型和神经网络的方法,本文提出的方法可使准确率提升8%,F值提高11%,召回率提高10%0[局限]由于现阶段在开源军事领域中公开标注数据集较为缺乏,所以未能在开源军事语料上训练BERT模型.[结论]但本文提出的基于预训练模型的开源军事命名实体识别方法,在一定程度上解决了边界划分问题,同时解决了在数据集不足的情况下实体识别任务表现不佳的问题.
文献关键词:
命名实体识别;预训练模型;神经网络
中图分类号:
作者姓名:
童昭;王露笛;朱小杰;杜一
作者机构:
中国科学院计算机网络信息中心,北京100083
文献出处:
引用格式:
[1]童昭;王露笛;朱小杰;杜一-.基于预训练模型的军事领域命名实体识别研究)[J].数据与计算发展前沿,2022(05):120-128
A类:
B类:
预训练模型,军事领域,命名实体识别,开源,非结构化,化军,Bidirectional,Encoder,Representations,from,Transformers,BERT,实体识别方法,模型生成,事语,语料,动态特征,特征词,词向量,字符,双向长短期记忆网络,Long,Short,Term,Memory,BiLSTM,成语,语义特征,条件随机场,Conditional,Random,Fields,CRF,军事数据,统计模型,准确率提升,召回率,开标
AB值:
0.33411
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。