典型文献
基于重采样和Voting异质集成的分类模型在肝硬化并发肝性脑病风险预测中的探索性研究
文献摘要:
目的 针对肝硬化并发肝性脑病风险预测的因素具有高维性、冗余性及类间不均衡的特征,研究变量筛选后的重采样和Voting异质集成分类模型的风险预测性能.方法 收集2006年1月-2015年12月某三甲医院消化内科肝硬化住院患者950例,68例并发肝性脑病,采用logistic逐步回归进行风险预报因子初筛;再采用SMOTE重采样技术及其改进算法处理不平衡数据;最后采用SVM、MLP、随机森林以及综合以上三种算法预测结果的Voting异质集成分类算法构建肝硬化并发肝性脑病的风险预测模型.结果 logistic回归筛选了7个风险预报因子,采用重采样技术后的分类模型的预测性能整体上优于不平衡数据模型,以SVM-SMOTE最优;相同重采样技术后的Voting异质集成与随机森林分类模型的预测性能优于SVM和MLP,其中Voting异质集成分类模型的性能略高于随机森林.综合各模型性能可知,采用SVM-SMOTE重采样技术处理的Voting异质集成模型在识别肝硬化并发肝性脑病的效果最好,测试集各评价指标值分别为:AUC=0.947、准确率=0.877、精确度=0.898、召回率=0.855、F1分数=0.876.结论 针对肝硬化并发肝性脑病风险预测因素的高维性、冗余性及类间不均衡的特征,本文所提出的基于logistic逐步回归特征筛选、SVM-SMOTE重采样的Voting异质集成模型的预测效果较为满意.
文献关键词:
肝性脑病;不平衡数据;重采样;集成学习;分类预测
中图分类号:
作者姓名:
王旭春;翟梦梦;任浩;李美晨;全帝臣;张岩波;刘近春;仇丽霞
作者机构:
山西医科大学卫生统计教研室 030001;山西医科大学第一医院消化内科
文献出处:
引用格式:
[1]王旭春;翟梦梦;任浩;李美晨;全帝臣;张岩波;刘近春;仇丽霞-.基于重采样和Voting异质集成的分类模型在肝硬化并发肝性脑病风险预测中的探索性研究)[J].中国卫生统计,2022(04):545-549
A类:
B类:
Voting,异质集成,分类模型,肝硬化并发肝性脑病,探索性研究,高维性,冗余性,变量筛选,集成分类,预测性能,三甲医院,消化内科,住院患者,logistic,逐步回归,预报因子,初筛,SMOTE,重采样技术,改进算法,不平衡数据,MLP,上三,算法预测,分类算法,风险预测模型,数据模型,随机森林分类,略高于,模型性能,技术处理,集成模型,测试集,指标值,召回率,预测因素,特征筛选,集成学习,分类预测
AB值:
0.229608
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。