典型文献
基于BERT的流行病学调查信息文本的命名实体识别
文献摘要:
为准确抽取流行病学调查信息中的关键实体,构建了基于COVID-19确诊病例流调信息文本的命名实体语料集;提出了基于BERT预训练语言模型的流行病学调查流调信息的命名实体识别方法.该方法首先通过预训练语言模型BERT根据字的上下文动态生成语义向量作为模型输入,通过嵌入条件随机场(CRF)的双向长短时记忆(BiLSTM)神经网络模型获取输入文本序列的上下文特征,解码标注提取出相应的9个实体类型.为进一步提升实体识别效果,对模型进行改进,继续增加注意力层,实验结果显示,模型识别的F1值在94.23%的基础上又提升了1.16%.
文献关键词:
流行病学调查信息;命名实体识别;字向量;BERT;注意力机制
中图分类号:
作者姓名:
徐美仙;谢晓尧;郑欣
作者机构:
贵州师范大学,贵州省信息与计算科学重点实验室,贵州 贵阳 550001
文献出处:
引用格式:
[1]徐美仙;谢晓尧;郑欣-.基于BERT的流行病学调查信息文本的命名实体识别)[J].贵州师范大学学报(自然科学版),2022(03):73-81
A类:
B类:
BERT,流行病学调查信息,命名实体识别,确诊病例,流调,语料,预训练语言模型,实体识别方法,动态生成,成语,模型输入,条件随机场,CRF,双向长短时记忆,BiLSTM,上下文特征,解码,实体类,注意力层,模型识别,字向量,注意力机制
AB值:
0.260734
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。