典型文献
融合LightGBM与SHAP的糖尿病预测及其特征分析方法
文献摘要:
人工智能在辅助医疗诊断方面得到广泛关注,对糖尿病预测的相关研究是近年来关注的一个热点问题.以皮马印第安人糖尿病数据集为研究对象,首先,对原始数据进行缺失值填充、异常值分析、标准化处理等工作的基础上,将预处理后的数据作为LightGBM训练模型的输入;其次,与已有工作中基于SVM、随机森林、决策树以及Xgboost等多种机器学习模型进行实验对比,结果表明本文模型在准确率、精确率、召回率、F1值、AUC值5项性能指标上均明显优于对比模型;最后,引入SHAP模型增强模型的可解释性,同时综合比较了LightGBM和Xgboost的特征重要性排序结果,识别出了影响糖尿病的主要因素,为糖尿病的疾病诊断提供决策参考.
文献关键词:
LightGBM模型;SHAP模型;糖尿病预测;特征分析
中图分类号:
作者姓名:
王鑫;廖彬;李敏;孙瑞娜
作者机构:
新疆财经大学统计与数据科学学院,乌鲁木齐830012;新疆大学信息科学与工程学院,乌鲁木齐830008;中国科学院信息工程研究所,北京100093;中国科学院大学网络空间安全学院,北京100093
文献出处:
引用格式:
[1]王鑫;廖彬;李敏;孙瑞娜-.融合LightGBM与SHAP的糖尿病预测及其特征分析方法)[J].小型微型计算机系统,2022(09):1877-1885
A类:
B类:
LightGBM,SHAP,糖尿病预测,医疗诊断,印第安人,糖尿病数据,集为,原始数据,缺失值填充,异常值,标准化处理,训练模型,决策树,Xgboost,机器学习模型,实验对比,精确率,召回率,对比模型,模型增强,增强模型,可解释性,特征重要性,重要性排序,疾病诊断,决策参考
AB值:
0.416894
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。