首站-论文投稿智能助手
典型文献
基于BERT在非结构化医疗文本数据处理中的研究与应用
文献摘要:
目的:基于BERT对医院近4年的肺部影像非结构化文本报告中的肺结节直径大小进行归类处理,以开发和利用非结构化数据的临床应用效能.方法:通过KETTLE清洗医院近4年有关肺结节的影像文本报告数据,随机选取500个样本报告,对报告中关于肺结节直径大小进行3分类标注,分别是:<8 mm、≥8 mm和未作描述;将标注的样本数据利用第四范式的基于BERT模型的文本分类模块进行自动机器学习,并发布成服务.结果:训练过程中,500个样本报告数据通过自动学习后,模型的准确率达到88.46%;之后对近4年13万份的肺结节报告通过训练后的模型进行了分类推论,并从中随机抽查了500份归类报告(不同于训练用数据),有462份符合实际情况,准确率高达92.40%.结论:BERT在非结构化医疗文本数据处理中更加方便,训练的样本量更少,准确率更高,降低了医疗文本利用最新自然语言处理技术进行学习的门槛.
文献关键词:
BERT;非结构化数据;肺结节;KETTLE;自然语言处理
作者姓名:
陈健;左秀然;孙淼
作者机构:
430014武汉,武汉市中心医院
文献出处:
引用格式:
[1]陈健;左秀然;孙淼-.基于BERT在非结构化医疗文本数据处理中的研究与应用)[J].中国数字医学,2022(02):30-33
A类:
KETTLE
B类:
BERT,医疗文本,文本数据,结构化文本,本报,肺结节,开发和利用,非结构化数据,应用效能,影像文本,数据利用,文本分类,自动机器学习,成服,训练过程,数据通,自动学习,万份,类推,推论,随机抽查,符合实际,样本量,本利,新自然,自然语言处理技术
AB值:
0.304296
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。