首站-论文投稿智能助手
典型文献
机器学习方法研究肝癌预测问题
文献摘要:
肝癌在所有癌症中病死率高居第二名.由于机器学习方法能改进疾病预测精度,因此文章将利用它们研究肝癌前期诊断问题,提高肝癌的预测精度.首先选取影响肝癌的10个指标作为预测变量,将579位肝癌患者分为两组:随机抽取492位患者构成训练样本,剩余87位患者构成测试样本.接着利用训练样本建立6个分类器:逻辑回归、L2惩罚逻辑回归、支持向量机(Support Vector Machine,SVM)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)、人工神经网络(Artificial Neural Network,ANN)和极限梯度提升算法(eXtreme Gradient Boosting,XGBoost),其中逻辑回归和L2惩罚逻辑回归采用Newton-Raphson算法得到模型参数的迭代加权最小二乘估计,计算患者肿瘤细胞为恶性和良性的概率估计,确定最佳阈值预测肿瘤性状.最后用测试样本计算混淆矩阵、灵敏度和特异度,绘制ROC曲线评价预测精度.结果表明L2惩罚逻辑回归预测精度最高,SVM预测精度排第二,XGBoost预测精度排第三,逻辑回归预测精度排第四,GBDT预测精度排第五,ANN和随机森林预测精度最差.
文献关键词:
L2惩罚逻辑回归;支持向量机;梯度提升树算法;人工神经网络;极限梯度提升算法
作者姓名:
胡雪梅;李佳丽;蒋慧凤
作者机构:
重庆工商大学数学与统计学院,重庆400067;经济社会应用统计重庆市重点实验室,重庆400067;长江上游经济研究中心,重庆400067
文献出处:
引用格式:
[1]胡雪梅;李佳丽;蒋慧凤-.机器学习方法研究肝癌预测问题)[J].系统科学与数学,2022(02):417-433
A类:
B类:
机器学习方法,病死率,高居,第二名,疾病预测,此文,癌前期,诊断问题,预测变量,肝癌患者,随机抽取,训练样本,分类器,逻辑回归,L2,Support,Vector,Machine,梯度提升决策树,Gradient,Boosting,Decision,Tree,GBDT,人工神经网络,Artificial,Neural,Network,ANN,极限梯度提升算法,eXtreme,XGBoost,Newton,Raphson,加权最小二乘估计,肿瘤细胞,恶性和良性,概率估计,最佳阈值,肿瘤性,混淆矩阵,评价预测,回归预测,梯度提升树算法
AB值:
0.369626
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。