首站-论文投稿智能助手
典型文献
基于集成学习模型的糖尿病患病风险预测研究
文献摘要:
为提高早期糖尿病患病风险的预测准确性,基于集成学习算法建立糖尿病患病风险预测模型.分别基于集成学习算法随机森林、GBDT和XGBoost建立糖尿病预测模型,并比较以上3种方法与单一分类器支持向量机和BP神经网络的分类预测性能.在UCI数据库的早期糖尿病数据集上进行验证试验,使用准确率、精确率、召回率、F1分数和AUC 5个指标评价模型效果,并基于最佳性能模型对变量重要性进行排序.所有模型中,基于集成学习的XGBoost算法准确率、精确率、召回率、F1值、AUC值最高,分别达到97.44%、99.02%、97.12%、98.06%、99.41%,比支持向量机的预测准确率提高了3.85%,比BP神经网络的预测准确率提高了2.57%.XGBoost算法给出的变量重要性排序中,影响权重排名前十的因素依次为烦渴、多尿症、脱发、无力、体重减轻等.基于随机森林、GBDT和XGBoost 3种集成学习算法的糖尿病患病风险预测模型表现出较好的性能,能比单分类器更准确地识别出早期高风险患者,有助于临床医生进行更精准的医疗决策.
文献关键词:
糖尿病;风险预测;集成学习;支持向量机;BP神经网络
作者姓名:
王琦琪;戴家佳;崔熊卫
作者机构:
贵州大学数学与统计学院,贵州贵阳550025;重庆医科大学附属第二医院,重庆400010
文献出处:
引用格式:
[1]王琦琪;戴家佳;崔熊卫-.基于集成学习模型的糖尿病患病风险预测研究)[J].软件导刊,2022(04):62-66
A类:
B类:
集成学习模型,患病风险,预测研究,预测准确性,集成学习算法,风险预测模型,GBDT,XGBoost,糖尿病预测,分类器,分类预测,预测性能,UCI,糖尿病数据,验证试验,精确率,召回率,指标评价模型,性能模型,变量重要性,预测准确率,重要性排序,影响权重,重排,多尿症,脱发,无力,体重减轻,单分类,高风险患者,临床医生,医疗决策
AB值:
0.331221
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。