首站-论文投稿智能助手
典型文献
基于多任务学习的电子病历实体识别方法
文献摘要:
中文电子病历NER是医疗信息抽取的难点.本文提出一种多任务学习的实体识别方法,联合实体识别和分词训练模型,使用基于Bi-LSTM的私有层提取专有信息,融合注意力网络作为共享层并增加通用特征增强机制来筛选全局信息,降低过拟合风险并增强模型的泛化能力.此外提出均衡样本过采样方法扩充数据集,有效解决实体类别不平衡所带来的问题.使用CCKS2017/CCKS2020电子病历实体识别语料和Medicine医药分词语料联合训练,实验结果显示本文提出的模型整体性能提升明显,同时也显著提高了Medicine语料的分词实验效果,F1值较基线提升了3个百分点.实验表明本文提出的模型能够有效改善因电子病历中数据不规范、无结构或专有名词等原因造成的实体切分错误等问题.
文献关键词:
深度学习;命名实体识别;多任务学习;神经网络;注意力机制
作者姓名:
于鹏;陈钰枫;徐金安;张玉洁
作者机构:
北京交通大学计算机与信息技术学院,北京 100044
文献出处:
引用格式:
[1]于鹏;陈钰枫;徐金安;张玉洁-.基于多任务学习的电子病历实体识别方法)[J].计算机与现代化,2022(09):40-50
A类:
B类:
多任务学习,实体识别方法,中文电子病历,NER,医疗信息,信息抽取,分词,训练模型,Bi,私有,注意力网络,共享层,特征增强,增强机制,全局信息,过拟合,增强模型,泛化能力,过采样,采样方法,充数,实体类别,类别不平衡,CCKS2017,CCKS2020,语料,Medicine,词语,联合训练,整体性能,性能提升,实验效果,百分点,无结,专有名词,切分,命名实体识别,注意力机制
AB值:
0.423967
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。