首站-论文投稿智能助手
典型文献
基于XGBoost的COVID-19患者重症风险早期预测模型的建立与评价
文献摘要:
目的 利用新型冠状病毒病(corona virus disease 2019,COVID-19)患者的临床特征数据构建XGBoost预测模型,并评价预测模型对COVID-19患者重症进展风险早期预测的效能.方法 对2020年2月10日至4月5日火神山医院病案系统内经实验室确诊的COVID-19患者进行筛选,共收集347例有完整医疗信息和实验室检查结果的患者数据.首先筛选出21个具有显著性差异的指标作为训练模型的输入特征;对构建的XGBoost模型进行贝叶斯优化以调整参数,并基于特征重要性筛选出最优特征组合;进一步分析各特征数值大小对预测结果的正负影响,利用SHAP(SHapley Additive exPlanation)对各特征重要性进行量化和归因;对XGBoost预测模型进行性能评价,并将其与其他机器学习方法进行对比,讨论其优势所在.结果 本研究选取21个重症组与非重症组差异显著的特征进行训练和验证.在K最邻近(k-nearest neighbor,KNN)模型中具有10个特征的最优子集获得了验证集中4个模型中曲线下面积(area under curve,AUC)值的最高值.年龄、脉率、白细胞计数、中性粒细胞计数、C-反应蛋白、总胆红素、肌酐、D-二聚体(D-Dimer)越高,疾病重症风险越高;淋巴细胞计数、白蛋白水平越低,疾病重症风险越高.XGBoost与支持向量机的预测性能优于其他机器学习方法(在测试集上AUC值分别为0.9420、0.9594),其中XGBoost训练速度明显更优.结论 基于XGBoost成功建立了预测模型,以最优特征子集实现了对COVID-19患者重症进展风险的早期预测.
文献关键词:
COVID-19;重症风险;预测模型;XGBoost;SHAP
作者姓名:
王铭;程振豪;胡苗;唐铭成;徐福民;王莉;粘永健;刘凯军
作者机构:
400042 重庆,陆军特色医学中心消化内科;400038 重庆,陆军军医大学(第三军医大学)基础医学院学员五大队;400038 重庆,陆军军医大学(第三军医大学)生物医学工程与影像医学系;430010 武汉,武汉市火神山医院感染一科
引用格式:
[1]王铭;程振豪;胡苗;唐铭成;徐福民;王莉;粘永健;刘凯军-.基于XGBoost的COVID-19患者重症风险早期预测模型的建立与评价)[J].陆军军医大学学报,2022(03):195-202
A类:
特征重要性筛选
B类:
XGBoost,重症风险,早期预测模型,建立与评价,新型冠状病毒病,corona,virus,disease,特征数据,评价预测,火神山医院,医院病案,病案系统,实验室确诊,共收,医疗信息,实验室检查,患者数据,训练模型,输入特征,贝叶斯优化,调整参数,优特,特征组合,正负影响,SHAP,SHapley,Additive,exPlanation,性能评价,机器学习方法,非重症,nearest,neighbor,KNN,最优子集,验证集,area,under,curve,最高值,脉率,白细胞计数,中性粒细胞计数,总胆红素,肌酐,二聚体,Dimer,病重,淋巴细胞计数,白蛋白水平,预测性能,测试集,训练速度,特征子集
AB值:
0.408355
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。