典型文献
基于WGCNA和SVM-RFE算法挖掘肺腺癌诊断和预后基因标志物
文献摘要:
目的 肺癌是世界上最常见的癌症之一,在众多肺癌患者中,肺腺癌(lung adenocarcinoma,LUAD)的死亡率最高.基因表达谱的变化与肿瘤的发生和发展过程有关,通过识别与LUAD患者相关的诊断和预后基因标志物,可以为肺腺癌的预防和治疗提供理论依据.方法 本研究以肿瘤基因组图谱(The Cancer Gene Atlas,TCGA)数据库为基础,采用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)、差异基因分析、coX回归分析、蛋白质互作网络(protein-protein interaction,PPI)分析等方法筛选与LUAD形成过程高度相关的hub基因.将TCGA和基因型组织表达(GTEx genotype tissue expression,GTEx)数据库中的RNA数据合并划分为训练集和内部验证集,利用基于支持向量机的递归特征消除算法(support vector machine recursive feature elimination feature,SVM-RFE)构建诊断模型并进行验证.GSE32863和GSE31210数据集分别用于验证诊断模型的准确性和基因标志物的预后价值.结果 SVM-RFE算法得到的5个基因标志物(anln、cenpa、plk1、tpx2、cdca3)模型在LUAD患者分类中具有显著的诊断能力.功能富集分析表明,这5个基因与肿瘤发生发展的生物学过程密切相关.此外,这5个基因高表达的LUAD患者的预后表现不良,死亡率显著高于低表达的患者.结论 我们的研究为LUAD的诊断和预后提供了具有5个基因特征的模型,这对于开发用于精确治疗的新靶点具有重要意义.
文献关键词:
肺腺癌;基因标志物;加权基因共表达网络分析;递归特征消除算法
中图分类号:
作者姓名:
王美;王可心;谭建军;王京京
作者机构:
北京工业大学环境与生命学部生物医学工程系,智能化生理测量与临床转化北京市国际科研合作基地,北京100124
文献出处:
引用格式:
[1]王美;王可心;谭建军;王京京-.基于WGCNA和SVM-RFE算法挖掘肺腺癌诊断和预后基因标志物)[J].生物化学与生物物理进展,2022(02):381-394
A类:
coX,anln,cenpa,plk1,tpx2,cdca3
B类:
WGCNA,RFE,肺腺癌,诊断和预后,预后基因,基因标志物,肺癌患者,lung,adenocarcinoma,LUAD,基因表达谱,预防和治疗,肿瘤基因组图谱,Cancer,Gene,Atlas,TCGA,加权基因共表达网络分析,weighted,gene,expression,network,analysis,差异基因分析,蛋白质互作网络,protein,interaction,PPI,hub,基因型,组织表达,GTEx,genotype,tissue,数据合并,训练集,内部验证,验证集,递归特征消除算法,support,vector,machine,recursive,feature,elimination,诊断模型,GSE32863,GSE31210,预后价值,患者分类,诊断能力,功能富集分析,肿瘤发生发展,生物学过程,预后表现,低表达,基因特征,新靶点
AB值:
0.349793
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。