典型文献
基于结构功能和实体识别的文本语义表示——以病历领域为例
文献摘要:
[目的]融合中文病历的结构功能信息,丰富病历文本的语义内涵,提升文本表示的准确性和后续文本挖掘效果.[方法]依据中文病历结构功能特征,创新文本语义表示策略,使用BiLSTM-CRF模型实现基于结构的命名实体智能识别,在词向量层面引入实体及结构信息,经由TextCNN模型进一步提取局部上下文特征,得到文本语义内涵更为丰富的向量表示形式.[结果]在命名实体识别实验中,基于结构的医疗实体识别精确率、召回率和F值分别达93.20%、95.19%和94.19%;在文本表示的分类验证实验中,所提病历文本表示方法的分类准确率达到92.12%.[局限]需进一步加强对更多类型文本的验证,细化结构识别过程,使所提方法更好地应用于文本挖掘工作.[结论]本文将病历结构功能信息引入病历文本表示工作,实验证明了其既能有效提高命名实体识别准确度,又能进一步丰富文本语义内涵和提升文本表示效果.
文献关键词:
中文病历;文本结构功能;命名实体识别;文本语义表示;BiLSTM-CRF模型
中图分类号:
作者姓名:
胡吉明;钱玮;文鹏;吕晓光
作者机构:
武汉大学信息管理学院 武汉430072;武汉大学信息检索与知识挖掘研究所 武汉430072;武汉大学马克思主义学院 武汉430072;武汉大学人民医院 武汉430060
文献出处:
引用格式:
[1]胡吉明;钱玮;文鹏;吕晓光-.基于结构功能和实体识别的文本语义表示——以病历领域为例)[J].数据分析与知识发现,2022(08):110-121
A类:
中文病历,文本结构功能
B类:
文本语义表示,语义内涵,文本表示,续文,文本挖掘,功能特征,BiLSTM,CRF,模型实现,体智能,智能识别,词向量,结构信息,TextCNN,局部上下文特征,向量表示,表示形式,命名实体识别,精确率,召回率,验证实验,表示方法,分类准确率,多类型,型文本,结构识别,识别过程,富文本
AB值:
0.25073
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。