首站-论文投稿智能助手
典型文献
基于主成分分析和差异表达基因构建口腔鳞状细胞癌诊断模型
文献摘要:
目的 探讨以主成分分析(principal component analysis,PCA)法分析口腔鳞状细胞癌(oral squamous cell carcinoma,OSCC)的差异表达基因(differentially expressed genes,DEGs)数据库构建的OSCC诊断模型的价值,为临床诊疗提供参考.方法 从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中获取OSCC和正常对照样本的RNA-seq表达数据,通过R软件对表达数据进行归一化和差异表达分析,以筛选出DEGs,并同时对DEGs行基因本体(gene ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析,以发现主要生物学特征.随机选取RNA-seq中DEGs表达数据的70%作为训练集以及30%作为测试集后,应用PCA法对训练集数据进行分析,提取与诊断OSCC相关的主成分(principal compo-nents,PC)构建PCA模型,再分别绘制训练集和测试集PCA模型的受试者工作特征(receiver operating characteris-tic,ROC)曲线并计算曲线下面积(area under curve,AUC),以评估PCA模型对OSCC诊断的准确性.结果 从TCGA数据库中获取OSCC和正常对照样本的RNA-seq表达数据分别为330例、32例.以错误发现率(false discovery rate,FDR)<0.001和|log2FC|(|log2 fold change|)>4为阈值,共筛选出159个下调和248个上调DEGs,主要富集在中间纤维、黑素体膜等细胞成分,以及色素和唾液相关的生物过程;主要参与唾液分泌、酪氨酸代谢等通路(P.adjust<0.05和Q<0.05).将DEGs拟作为诊断OSCC的肿瘤标志物,对训练集行PCA分析显示,主成分前3位PC1、PC2、PC3方差的贡献率分别为0.873、0.100、0.023,三者累计方差的贡献率为0.996,主成分前3位PC1、PC2、PC3包含颌下腺雄激素调节蛋白3B(submaxillary gland androgen regulated protein 3B,SMR3B)、富含脯氨酸27(proline rich 27,PRR27)、组蛋白3(histatin 3,HTN3)、抗凝素(statherin,STATH)、胱抑素D(cys-tatin D,CST5)、包含A族成员2的BPI折叠(BPI fold containing family A member 2,BPIFA2)、富含脯氨酸的蛋白质HaeⅢ亚家族2(proline rich protein HaeⅢsubfamily 2,PRH2)、角蛋白35(keratin 35,KRT35)、组蛋白1(histatin 1,HTN1)、淀粉酶α1B(amylase alpha 1B,AMY1B).进一步结合三者的特征向量构建OSCC的PCA诊断模型,在训练集和测试集ROC曲线中显示该模型的AUC值分别为0.852、0.844,均高于其他基因.结论 基于PCA法和DEGs构建的以SMR3B、PRR27、HTN3、STATH、CST5、BPIFA2、PRH2、KRT35、HTN1和AMY1B表达水平为基础的OSCC诊断模型有较高的诊断优势,可为OSCC的早期基因诊断以及PCA模型在临床诊断中的应用提供理论依据.
文献关键词:
口腔鳞状细胞癌;差异表达基因;肿瘤标志物;早期诊断;基因诊断;主成分分析;诊断模型;生物信息学
作者姓名:
温凌杜;王子弘;张国明;赖茜;杨宏宇
作者机构:
广州医科大学研究生院,广东 广州 510000;深圳市宝安中医院(集团)口腔科,广东 深圳 518000;深圳市宝安妇幼保健院口腔科,广东 深圳 518000;北京大学深圳医院口腔科,广东深圳 518000
文献出处:
引用格式:
[1]温凌杜;王子弘;张国明;赖茜;杨宏宇-.基于主成分分析和差异表达基因构建口腔鳞状细胞癌诊断模型)[J].口腔疾病防治,2022(04):251-257
A类:
submaxillary,SMR3B,PRR27,histatin,HTN3,statherin,STATH,tatin,CST5,BPIFA2,PRH2,KRT35,HTN1,AMY1B
B类:
差异表达基因,口腔鳞状细胞癌,诊断模型,principal,component,analysis,oral,squamous,cell,carcinoma,OSCC,differentially,expressed,genes,DEGs,数据库构建,临床诊疗,癌症基因组图谱,Cancer,Atlas,TCGA,正常对照,照样,seq,差异表达分析,并同,基因本体,ontology,京都基因与基因组百科全书,Kyoto,Encyclopedia,Genes,Genomes,富集分析,生物学特征,训练集,测试集,nents,受试者工作特征,receiver,operating,characteris,tic,area,under,curve,错误发现率,false,discovery,rate,FDR,log2FC,fold,change,黑素体,细胞成分,唾液,生物过程,酪氨酸,酸代谢,adjust,拟作为,肿瘤标志物,PC1,PC2,PC3,颌下腺,雄激素,激素调节,调节蛋白,gland,androgen,regulated,protein,脯氨酸,proline,rich,组蛋白,抗凝,胱抑素,cys,折叠,containing,member,Hae,亚家族,subfamily,角蛋白,keratin,淀粉酶,amylase,alpha,特征向量,诊断优势,早期基因,基因诊断
AB值:
0.329644
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。