首站-论文投稿智能助手
典型文献
基于NLP的中医医案文本快速结构化方法
文献摘要:
中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承.为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法.将《中国现代名中医医案精粹》作为结构化对象,采用光学字符识别技术识别医案截图的文本,同时对文本做初步结构化.构建简单症状词典,采用结合词典的改进的N-gram模型获取医案文本中的症状、体征等词,并在结构化过程中更新词典,实现了对4 754份文本医案的结构化.随机选取666份医案文本对最终模型进行测试,其F1值达到82.99%.
文献关键词:
N-gram模型;自然语言处理;中医医案;中文分词;光学字符识别
作者姓名:
肖晓霞;刘明婷;杨冯天赐;刘鉴建县;杨阳;石月
作者机构:
湖南中医药大学信息科学与工程学院,湖南 长沙410208;湖南大学信息科学与工程学院,湖南 长沙410082;湘潭大学化学学院,湖南 湘潭411105;湖南泽塔科技有限公司,湖南 长沙410012;东北林业大学工程技术学院,黑龙江 哈尔滨150040;北京瑞迪弘欣科贸有限公司,北京100071
文献出处:
引用格式:
[1]肖晓霞;刘明婷;杨冯天赐;刘鉴建县;杨阳;石月-.基于NLP的中医医案文本快速结构化方法)[J].大数据,2022(03):128-139
A类:
B类:
NLP,中医医案,结构化方法,中医医生,临床经验,重要文献,结构化处理,中医传承,自然语言处理,代名,名中医,精粹,光学字符识别,技术识别,截图,状词,词典,gram,结构化过程,新词,终模型,中文分词
AB值:
0.328988
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。