首站-论文投稿智能助手
典型文献
基于多核学习的弥漫大B细胞淋巴瘤早期复发的精准预测
文献摘要:
目的 对山西省某三甲医院2011-2017年间血液科新诊断的弥漫大B细胞淋巴瘤患者(diffuse large B-cell lymphoma,DLBCL)是否实现两年无事件生存,即DLBLC患者早期复发的预测.方法 根据无事件生存期,将患者分成早期复发和非早期复发,并以此为标签构建分类模型.首先对数据进行了归一化处理,然后用LASSO进行了特征选择,因数据类别不平衡,分别采用了SMOTE(synthetic minority over-sampling technique)、Borderline-1 SMOTE、Borderline-2 SMOTE与ADASYN(adaptive synthetic sampling)四种方法平衡数据,之后构建了基于支持向量机的多核模型作为最终的分类器,并与AdaBoost、随机森林和以高斯核、多项式核为内核的单核支持向量机进行比较,最终实现对新诊断病例早期复发的预测.结果 在本文所有模型中,采用LASSO加Borderline-1 SMOTE的多核模型(accuracy=0.87,precision=0.87,recall=0.87,f1=0.87,AUC=0.87)取得了最优的分类性能.采用SMOTE的随机森林模型(accuracy=0.84,preci-sion=0.85,recall=0.87,f1=0.79,AUC=0.83)、Borderline-2 SMOTE的随机森林(accuracy=0.84,precision=0.85,re-call=0.87,f1=0.79,AUC=0.83)两种集成模型的分类性能也较好,但都低于多核支持向量机模型.两种单核支持向量机性能较差.结论 本文构建的所有模型中,经过LASSO和Borderline-1 SMOTE重采样的多核支持向量机性能最优,可为DLBCL早期复发预测提供参考.
文献关键词:
弥漫大B细胞淋巴瘤;早期复发;多核学习;不平衡数据
作者姓名:
邢蒙;周洁;余红梅;张岩波;阳桢寰;赵艳琳;李雪玲;李琼;赵志强;罗艳虹
作者机构:
山西医科大学公共卫生学院卫生统计教研室 030001;重大疾病风险评估山西省重点实验室;山西省肿瘤医院PET/CT中心;山西省肿瘤医院血液科
文献出处:
引用格式:
[1]邢蒙;周洁;余红梅;张岩波;阳桢寰;赵艳琳;李雪玲;李琼;赵志强;罗艳虹-.基于多核学习的弥漫大B细胞淋巴瘤早期复发的精准预测)[J].中国卫生统计,2022(04):518-521,528
A类:
DLBLC
B类:
多核学习,弥漫,细胞淋巴瘤,早期复发,精准预测,三甲医院,血液科,新诊断,diffuse,large,cell,lymphoma,DLBCL,无事件生存,生存期,分类模型,归一化处理,LASSO,特征选择,数据类别,类别不平衡,SMOTE,synthetic,minority,over,sampling,technique,Borderline,ADASYN,adaptive,四种方法,分类器,AdaBoost,高斯核,多项式,accuracy,precision,recall,f1,分类性能,随机森林模型,集成模型,多核支持向量机,支持向量机模型,重采样,复发预测,不平衡数据
AB值:
0.311901
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。