典型文献
基于Stacking集成学习的肾综合征出血热发病数据预测模型研究
文献摘要:
目的 探讨基于Stacking结构的集成模型在预测分析辽宁省肾综合征出血热发病趋势中的可行性.方法 利用公共卫生科学数据中心2005-2018年肾综合征出血热发病数据,以集成学习方法和非集成学习方法为基学习器,以线性回归为元学习器构建Stacking集成学习模型,比较单一预测模型和由不同类预测模型组合而成的Stacking集成学习模型的预测精度.通过五折交叉验证优化参数,对肾综合征出血热发病数据进行预测,并评价模型的预测能力,采用平均绝对误差和均方根误差评价模型的预测效果.结果 最小绝对收缩和选择算子回归、多层感知器、支持向量机、随机森林、极度梯度提升树和Stacking集成学习模型交叉验证结果的平均绝对误差均值分别为48.13,49.93,47.68,23.21,23.07,24.89,经拟合设置最优参数后各模型的平均绝对误差分别为25.54,44.58,25.57,21.25,19.47,22.49;各模型交叉验证结果的均方根误差平均值分别为55.23,56.91,54.74,28.87,29.20,31.23,经拟合设置最优参数后各模型的均方根误差分别为30.24,55.24,29.56,28.41,28.47,27.77.结论 基于随机森林、极度梯度提升树和Stacking集成学习模型构建的发病人数预测模型对辽宁省肾综合征出血热发病的预测准确率优于最小绝对收缩和选择算子回归、多层感知器和支持向量机等单一模型.本研究为疾病防控工作中预测模型的选择提供一定的方法学参考.
文献关键词:
Stacking;模型;肾综合征出血热;预测
中图分类号:
作者姓名:
李英杰;王岩;贾艺林;丁林敏;何芷君;单连峰;黄德生;关鹏
作者机构:
中国医科大学公共卫生学院流行病学教研室 110122;中国医科大学智能医学学院智能计算教研室
文献出处:
引用格式:
[1]李英杰;王岩;贾艺林;丁林敏;何芷君;单连峰;黄德生;关鹏-.基于Stacking集成学习的肾综合征出血热发病数据预测模型研究)[J].中国卫生统计,2022(06):811-814
A类:
B类:
Stacking,肾综合征出血热,发病数,数据预测,集成模型,预测分析,发病趋势,卫生科,科学数据中心,集成学习方法,基学习器,元学习,集成学习模型,模型组合,组合而成,五折交叉验证,验证优化,优化参数,预测能力,平均绝对误差,最小绝对收缩和选择算子,多层感知器,极度,梯度提升树,误差均值,最优参数,病人数,预测准确率,疾病防控,防控工作,方法学
AB值:
0.219387
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。