使用机器学习建立慢性阻塞性肺疾病患者重度气流受限风险预警模型研究|周丽娟;温贤秀;吕琴;蒋蓉;吴行伟;周黄源;向超|610072 四川省成都市,电子科技大学医学院 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

使用机器学习建立慢性阻塞性肺疾病患者重度气流受限风险预警模型研究

文献摘要：

背景气流受限程度是评价慢性阻塞性肺疾病(COPD)患者疾病进展的关键指标.然而由于检查禁忌、依从性等问题,导致部分患者难以开展相关检查,无法评价疾病严重程度.目的建立并评估基于机器学习算法的COPD患者重度气流受限风险预警模型.方法采用横断面设计调查2019年1月至2020年6月四川省某三甲医院的COPD住院患者,收集患者一般临床指标与肺功能检查数据.将数据按8:2比例随机分为训练集和测试集,在训练集中使用4种缺失值填充方法、3种特征筛选方法、17种机器学习和1种集成学习算法构建216种风险预警模型.采用ROC曲线下面积(AUC)、准确率、精确率、召回率和F1值评价模型的预测性能,分别使用十折交叉验证法和Bootstrapping算法进行内部验证和外部验证.使用测试集数据进行模型测试和选择.使用后验法进行样本量验证.结果共纳入418例患者,其中212例(50.7％)患者存在重度以上气流受限风险.经4种缺失值处理和3种特征筛选后,共获得12个处理后的数据集及12种影响气流受限因素的重要性排序,结果显示,呼吸困难指数评分(mMRC)等级、年龄、体质指数(BMI)、吸烟史(有、无)、慢性阻塞性肺疾病评估表(CAT)评分、呼吸困难(有、无)在变量特征排序中居于前列,是构造模型的关键指标,对结果预测有重要作用.其中,采取不填充、Lasso筛选方法后,mMRC等级、吸烟史(有、无)、呼吸困难(有、无)为位居前3位的预测因子,mMRC等级占特征重要性的54.15％.使用不填充、Boruta筛选方法后,CAT评分、年龄、mMRC等级为位居前3位的预测因子,CAT评分占特征重要性的26.64％.使用17种机器学习和1个集成学习算法对12个数据集分别建模,共得216个预测模型.17种机器学习算法十折交叉验证结果显示,不同算法预测性能比较,差异有统计学意义(P<0.05),随机梯度下降算法的平均AUC最大,为(0.738±0.089).使用Bootstrapping算法对测试集进行外部验证结果显示,不同算法所得模型的预测性能比较,差异有统计学意义(P<0.05),集成学习算法的平均AUC最大,为(0.757±0.057).利用Bootstrapping算法对4种缺失值处理和3种特征筛选预测性能评价结果显示,当不填充和Lasso筛选时,可提高模型的性能,差异有统计学意义(P<0.05).使用测试集数据对216个机器学习模型进行测试,最佳模型的AUC为0.7909,准确率为75.90％,精确率为75.00％,召回率为78.57％,F1值为0.7674.样本量验证结果提示研究样本量可满足建模需求.结论本研究建立并评价了COPD患者重度气流受限风险预警模型,mMRC等级、年龄、BMI、CAT评分、是否有吸烟史和呼吸困难是影响气流受限的关键指标.该模型预测效果良好,具有潜在的临床应用前景.

文献关键词：

肺疾病;慢性阻塞性;机器学习;气流受限程度;肺功能;呼吸功能试验;预测模型

中图分类号：

[1] 医药、卫生（R） / 内科学（R5） / 呼吸系及胸部疾病（R56） / 肺疾病（R563） / 其他（R563.9）

[2] 医药、卫生（R） / 内科学（R5） / 呼吸系及胸部疾病（R56） / 肺疾病（R563）

[3] 医药、卫生（R） / 临床医学（R4） / 护理学（R47） / 专科护理学（R473） / 内科护理学（R473.5）

作者姓名：

周丽娟;温贤秀;吕琴;蒋蓉;吴行伟;周黄源;向超

作者机构：

610072 四川省成都市,电子科技大学附属医院·四川省人民医院呼吸与危重症医学科;610072 四川省成都市,电子科技大学医学院;610072 四川省成都市,电子科技大学附属医院·四川省人民医院护理部;610072 四川省成都市,电子科技大学附属医院·四川省人民医院药学部;610072 四川省成都市,电子科技大学医学院,个体化药物治疗四川省重点实验室

文献出处：

中国全科医学

引用格式：

[1]周丽娟;温贤秀;吕琴;蒋蓉;吴行伟;周黄源;向超-.使用机器学习建立慢性阻塞性肺疾病患者重度气流受限风险预警模型研究)[J].中国全科医学,2022(02):217-226

A类：

B类：

慢性阻塞性肺疾病,风险预警模型,气流受限程度,COPD,疾病进展,关键指标,查禁,禁忌,依从性,相关检查,疾病严重程度,基于机器学习,机器学习算法,横断面设计,设计调查,三甲医院,住院患者,临床指标,肺功能检查,检查数据,训练集,测试集,缺失值填充,填充方法,特征筛选,筛选方法,集成学习算法,精确率,召回率,十折交叉验证法,Bootstrapping,内部验证,外部验证,模型测试,样本量,缺失值处理,共获,受限因素,重要性排序,呼吸困难指数,mMRC,体质指数,吸烟史,疾病评估,评估表,CAT,特征排序,中居,居于,构造模型,Lasso,预测因子,特征重要性,Boruta,分占,算法预测,性能比较,随机梯度下降算法,预测性能评价,机器学习模型,临床应用前景,呼吸功能试验

AB值：

0.261935

相似文献

慢性阻塞性肺疾病稳定期患者共患疾病与死亡风险的关系研究

李然;刘晓芳;王玉红;白澎-100730 北京,首都医科大学附属北京同仁医院呼吸与危重医学科

血清超敏C反应蛋白与前白蛋白比值对慢性阻塞性肺疾病急性加重期患者30日再入院的预测价值

丁瑞阳;张谷香;杨文柱;裴志强;张宁-237000 安徽六安,皖西卫生职业学院附属医院呼吸内科

慢性阻塞性肺疾病急性加重期肺康复治疗时机和频次的研究

金文静;郭晓霞;周超-200120 上海,上海市浦东新区人民医院呼吸内科;上海市浦东新区光明中医医院呼吸内科

稳定期慢性阻塞性肺疾病的规范化治疗及治疗现状

陈平;成玮-中南大学湘雅二医院呼吸与危重症医学科;中南大学呼吸疾病研究所,湖南长沙 410011

吸烟与贫血交互作用影响慢性阻塞性肺疾病易感性的临床研究