典型文献
基于RoBERTa的BiLSTM-CRF模型在中文病案实体识别中的应用研究
文献摘要:
目的:构建适用于中文电子病案审核的命名实体识别模型,提高医院统计部门相关病案审核的工作效率,为人工智能技术在医疗卫生行业的应用奠定基础.方法:基于1 700条真实中文电子病历,选取"症状体征""疾病诊断""治疗方式""解剖部位""影像检查""手术"等作为主要实体,结合经人工审核的病案结果进行BIOES标注,基于RoBERTa的BiLSTM-CRF算法,构建中文病案实体识别模型.结果:所建实体识别模型在CCKS2017中准确率为94.80%,召回率为96.03%,F1值为0.95;在CCKS2019中准确率为81.91%,召回率为83.03%,F1值为0.83.与传统基于Word2Vec、BERT的识别模型相比,RoBERTa-BiLSTM-CRF模型具有更优的效果.结论:基于RoBERTa的BiLSTM-CRF模型在中文电子病案实体识别中效果良好,能够对中文电子病历进行有效的初步识别和筛查,提高相关统计人员的审核效率.
文献关键词:
住院病案;中文电子病历;命名实体识别;RoBERTa
中图分类号:
作者姓名:
许思特;孙木
作者机构:
200020 上海,上海交通大学医学院附属瑞金医院统计信息科
文献出处:
引用格式:
[1]许思特;孙木-.基于RoBERTa的BiLSTM-CRF模型在中文病案实体识别中的应用研究)[J].中国数字医学,2022(08):37-42
A类:
BIOES
B类:
RoBERTa,BiLSTM,CRF,电子病案,命名实体识别,识别模型,高医,医院统计,统计部门,医疗卫生行业,中文电子病历,症状体征,疾病诊断,解剖部位,影像检查,CCKS2017,召回率,CCKS2019,Word2Vec,关统,统计人员,住院病案
AB值:
0.25848
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。