FAILED
首站-论文投稿智能助手
典型文献
中文电子病历命名实体识别的研究与进展
文献摘要:
海量电子病历(Electronic Medical Record,EMR)数据是支撑医疗智能化研究的重要原料,然而电子病历文本数据的半结构化甚至无结构化特点,造成后续对其分析利用的极大困难.虽然近年来基于深度学习的命名实体识别(Named Entity Recognition,NER)成为对电子病历进行自动化信息抽取的核心技术,但鉴于中文电子病历(Chi-nese Electronic Medical Record,CEMR)具有包括病历文本的非规范性与专业性、医疗实体的独特性和标注语料的稀缺性在内的独特文本数据特征,该研究目前仍存在诸多挑战.本文对中文电子病历命名实体识别的研究与进展进行了综述,系统梳理了命名实体识别的概念、相关理论模型以及制约中文电子病历命名实体识别准确率和识别效率的主要原因;从技术发展角度详细分析了中文电子病历命名实体识别方法的变革历程;并对中文电子病历命名实体识别效果做了实验验证与深入分析,指出了现有模型的不足与改进方向.鉴于国内近年来与中文信息学处理相关的测评会议CCKS持续关注中文电子病历命名实体识别,本文特别对CCKS在该领域五年来的全部代表性测评论文做了纵横对比分析,并通过在主流模型上的深入实验与研究,为后续该领域的继续推进寻求了思路.
文献关键词:
中文电子病历;命名实体识别;深度学习;预训练模型;自然语言处理;医疗信息化
作者姓名:
杜晋华;尹浩;冯嵩
作者机构:
清华大学北京信息科学与技术国家研究中心,北京 100084;中南大学湘雅医院,湖南长沙 410008
文献出处:
引用格式:
[1]杜晋华;尹浩;冯嵩-.中文电子病历命名实体识别的研究与进展)[J].电子学报,2022(12):3030-3053
A类:
CEMR
B类:
中文电子病历,命名实体识别,Electronic,Medical,Record,文本数据,无结,Named,Entity,Recognition,NER,信息抽取,Chi,nese,非规范性,语料,稀缺性,数据特征,识别准确率,实体识别方法,变革历程,现有模型,不足与改进,改进方向,中文信息,CCKS,持续关注,流模型,预训练模型,自然语言处理,医疗信息化
AB值:
0.221761
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。