FAILED
首站-论文投稿智能助手
典型文献
基于知识库实体增强BERT模型的中文命名实体识别
文献摘要:
针对预训练模型BERT存在词汇信息缺乏的问题,在半监督实体增强最小均方差预训练模型的基础上提出了一种基于知识库实体增强BERT模型的中文命名实体识别模型OpenKG+Entity Enhanced BERT+CRF.首先,从中文通用百科知识库CN-DBPedia中下载文档并用Jieba中文分词抽取实体来扩充实体词典;然后,将词典中的实体嵌入到BERT中进行预训练,将训练得到的词向量输入到双向长短期记忆网络(BiLSTM)中提取特征;最后,经过条件随机场(CRF)修正后输出结果.在CLUENER 2020和MSRA数据集上进行模型验证,将所提模型分别与Entity Enhanced BERT Pre-training、BERT+BiLSTM、ERNIE和BiLSTM+CRF模型进行对比实验.实验结果表明,该模型的F1值在两个数据集上比四个对比模型分别提高了1.63个百分点和1.1个百分点、3.93个百分点和5.35个百分点、2.42个百分点和4.63个百分点以及6.79个百分点和7.55个百分点.可见,所提模型对命名实体识别的综合效果得到有效提升,F1值均优于对比模型.
文献关键词:
命名实体识别;知识库;实体词典;预训练模型;双向长短期记忆网络
作者姓名:
胡婕;胡燕;刘梦赤;张龑
作者机构:
湖北大学计算机与信息工程学院,武汉 430062;华南师范大学计算机学院,广州 510631
文献出处:
引用格式:
[1]胡婕;胡燕;刘梦赤;张龑-.基于知识库实体增强BERT模型的中文命名实体识别)[J].计算机应用,2022(09):2680-2685
A类:
OpenKG+Entity,BERT+CRF,DBPedia,实体词典,CLUENER
B类:
基于知识,知识库,中文命名实体识别,预训练模型,半监督,最小均方差,识别模型,Enhanced,百科知识,CN,下载,载文,文档,Jieba,中文分词,实体嵌入,练得,词向量,双向长短期记忆网络,提取特征,条件随机场,输出结果,MSRA,模型验证,Pre,training,BERT+BiLSTM,ERNIE,BiLSTM+CRF,对比模型,百分点,综合效果
AB值:
0.233061
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。