典型文献
基于甲基化位点的筛选建模诊断结直肠癌
文献摘要:
目的 利用癌症基因组图谱(the cancer genome atlas,TCGA)中的结直肠癌27 K甲基化数据和临床随访数据,挖掘与结直肠癌不良预后相关的因素及建立结直肠癌诊断模型.方法 自2020年12月—2021年9月,在TCGA网站下载207例结直肠癌27 K甲基化测序数据和相关临床资料.用R语言edger软件包筛选出差异甲基化位点,然后使用SPSS软件对差异甲基化位点进行ROC分析、逐步回归分析,筛选出对结直肠癌诊断有意义的位点.应用支持向量机、神经网络等建立起基于数个DNA甲基化位点的数学模型,并在GEO数据库中获取独立数据集GSE131013来评估结直肠癌诊断模型的性能.同时利用Kaplan-Meier(KM)单因素分析法和Cox多因素分析法对临床数据指标和甲基化位点进行生存分析,筛选出与结直肠癌不良预后有关的因素.结果 筛选出6个于结直肠癌有诊断潜力的位点:cg00240432、cg06744574、cg08090772、cg13577076、cg17872757和cg24446548.基于6个DNA甲基化位点建立ANN模型、Logistic回归模型、SVM模型,3种模型10折交叉验证平均准确率分别为99.0%、98.0%、99.5%,漏诊率分别为1.0%、2.0%、0.5%.运用GEO数据库中的独立数据集验证模型,3种模型的准确率分别为92.9%、85.8%、91.2%.KM生存分析发现cg24446548高甲基化以及结直肠癌晚期(Ⅲ、Ⅳ期)与结直肠癌不良预后有关(P<0.05).Cox多因素分析发现肿瘤分期对生存期有明显影响(P<0.05).结论 筛选出的甲基化位点具有诊断结直肠癌的潜能.在基于甲基化位点的筛选建立的3种模型中,ANN和SVM模型分类和预测性能较好.结直肠癌患者的cg24446548位点高甲基化以及肿瘤晚期(Ⅲ、Ⅳ期)预示着不良预后.
文献关键词:
结直肠癌;机器学习;甲基化;10折交叉验证
中图分类号:
作者姓名:
薛春萌;高洁;李嘉乐;李荣佳;刘畅;梁建伟
作者机构:
山东第一医科大学第一附属医院(山东省千佛山医院)健康管理学,山东省健康体检工程实验室,山东济南250000;山东第一医科大学基础医学院,山东济南 250000;山东省泰安市中心医院普外科,山东泰安 271000
文献出处:
引用格式:
[1]薛春萌;高洁;李嘉乐;李荣佳;刘畅;梁建伟-.基于甲基化位点的筛选建模诊断结直肠癌)[J].系统医学,2022(15):39-45
A类:
edger,GSE131013,cg00240432,cg06744574,cg08090772,cg13577076,cg17872757,cg24446548
B类:
甲基化位点,癌症基因组图谱,cancer,genome,atlas,TCGA,临床随访,随访数据,不良预后,诊断模型,站下,下载,甲基化测序,序数,软件包,出差,逐步回归分析,数个,GEO,独立数,Kaplan,Meier,KM,单因素分析法,Cox,多因素分析,临床数据,生存分析,诊断潜力,ANN,交叉验证,平均准确率,漏诊率,数据集验证,验证模型,高甲基化,结直肠癌晚期,肿瘤分期,生存期,模型分类,分类和预测,预测性能,结直肠癌患者,肿瘤晚期,预示
AB值:
0.223283
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。