典型文献
基于混合深度学习的中文医学实体抽取研究
文献摘要:
[目的/意义]医学实体抽取是医疗健康领域信息组织和知识挖掘的关键环节.针对中文医学实体专业性强、命名规则复杂和抽取难度大的现状,探究如何利用多种深度学习方法混合协作以提升中文医学实体抽取的准确性.[方法/过程]首先在深度学习模型BiLSTM-CRF基础上,引入语言模型BERT和迭代膨胀卷积神经网络IDCNN,增强文本语义表征能力和局部特征捕获能力;接着利用BERT预训练进行外部医学语料资源的知识迁移,实现多语义特征融合;然后引入自注意力机制捕获全局上下文重要信息,并加入Highway优化深层网络训练,解决网络加深导致的精度下降问题,最终提出MF-HDL(Multi Feature-Hybrid Deep Learning)模型.[结果/结论]MF-HDL模型在中文糖尿病数据集上效果显著,其F1值较基准模型IDCNN-CRF和BiLSTM-CRF分别提升18.42%和17.18%,此方法在中文医学实体抽取任务上表现优异.
文献关键词:
混合深度学习;医学实体抽取;BERT;注意力;Highway
中图分类号:
作者姓名:
韩普;顾亮
作者机构:
南京邮电大学管理学院 南京210003;江苏省数据工程与知识服务重点实验室 南京210023
文献出处:
引用格式:
[1]韩普;顾亮-.基于混合深度学习的中文医学实体抽取研究)[J].图书情报工作,2022(14):119-127
A类:
医学实体抽取
B类:
混合深度学习,医疗健康领域,域信息,信息组织,知识挖掘,体专,命名规则,深度学习方法,深度学习模型,BiLSTM,CRF,语言模型,BERT,迭代膨胀卷积神经网络,IDCNN,文本语义,语义表征,表征能力,局部特征,获能,预训练,语料,知识迁移,多语,语义特征融合,自注意力机制,全局上下文,重要信息,Highway,深层网络,网络训练,MF,HDL,Multi,Feature,Hybrid,Deep,Learning,糖尿病数据
AB值:
0.383721
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。