首站-论文投稿智能助手
典型文献
基于Aho_Corasick算法的中医药数据清洗方法
文献摘要:
中医药经过数千年的发展,积累了大量的各种类型的数据.很多研究人员利用大数据技术,对方剂或药品数据预处理后,使用相关算法挖掘和探寻疾病诊疗规律,为新药研制、疾病诊治、医学科研提供科学的依据.但随着方剂规模的增大,人工预处理的方式效率低且易出错.因此,文章提出一种基于Aho_Corasick算法的清洗方法,将药物作为模式串,对方剂或药品的药物信息进行识别,规范统一方剂中的药物名称,为后续挖掘工作提供高质量的数据.实验结果显示,准确率达到95%以上,数据清洗效果明显.
文献关键词:
中医药;大数据技术;Aho_Corasick算法;预处理;数据清洗
作者姓名:
郭春丽;纪树峰;林源;黄海松;王俐良
作者机构:
广东财贸职业学院信息技术学院,广东 广州 510445;广东财贸职业学院图书馆
文献出处:
引用格式:
[1]郭春丽;纪树峰;林源;黄海松;王俐良-.基于Aho_Corasick算法的中医药数据清洗方法)[J].计算机时代,2022(03):77-80
A类:
B类:
Aho,Corasick,中医药数据,数据清洗,清洗方法,数千年,各种类型,方剂,品数,数据预处理,疾病诊疗,新药,医学科研,出错,模式串,规范统一,药物名称,清洗效果
AB值:
0.367475
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。