典型文献
一种基于特征融合的医疗病例实体识别方法
文献摘要:
在医学领域,传统的命名实体识别方法在医疗病历实体识别过程中,存在文本提取特征单一及不充分等问题,导致模型识别精准度不高.针对此问题,文章提出一种基于语义、词序、BERT预训练模型相结合的多特征融合提取方法.引入Word2vec对文本进行语义特征提取,利用Fasttext对文本的词序特征进行提取,通过BERT预训练模型获取词向量,解决Word2vec无法解决一词多义的问题.将多元特征向量融合,对相关数据的特征进行提取融合.通过卷积神经网络对融合特征进行再提取,得到更有价值的数据特征.最后通过双向长短时记忆神经网络结合条件随机场模型(BiLSTM-CRF)进行实体识别.实验结果表明:此方法在ChineseBLUE(cMedQANER)数据集上,其精准度、召回率、F1-Measure值等评价指标都有显著的提升.
文献关键词:
医疗病历;实体识别方法;双向transformer编码模型(BERT)预训练词向量;文本卷积神经网络;长短时记忆神经网络;条件随机场
中图分类号:
作者姓名:
帅英杰
作者机构:
广西民族大学 人工智能学院,广西 南宁 530006
文献出处:
引用格式:
[1]帅英杰-.一种基于特征融合的医疗病例实体识别方法)[J].广西职业技术学院学报,2022(02):63-68
A类:
医疗病历实体,Fasttext,ChineseBLUE,cMedQANER
B类:
实体识别方法,医学领域,命名实体识别,识别过程,提取特征,模型识别,词序,BERT,预训练模型,多特征融合,Word2vec,语义特征,取词,词向量,一词多义,多元特征,特征向量,向量融合,融合特征,数据特征,双向长短时记忆神经网络,条件随机场,BiLSTM,CRF,召回率,Measure,transformer,文本卷积神经网络
AB值:
0.270819
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。