典型文献
基于生物信息学及机器学习算法筛选前列腺癌的关键表达基因及相关免疫细胞浸润分析
文献摘要:
目的:通过生物信息学及机器学算法筛选及分析前列腺癌的关键表达基因,探究诊断前列腺癌的生物标志物及与前列腺癌免疫细胞浸润的相关性。方法:使用生物信息学方法从基因表达谱(GEO)数据库中下载3个前列腺癌组织信使RNA(mRNA)芯片数据集:其中GSE46602和GSE69334作为训练集,GSE32571作为验证集。对数据集GSE46602及数据集GSE69223两个数据集进行合并分析后获得差异表达基因(DEGs),京都基因与基因组百科全书(KEGG)、基因本体论(GO)、疾病富集分析(DO)与基因富集分析(GSEA)用于功能富集分析。Lasso回归筛选特征基因11个,支持向量机(SVM)筛选特征基因2个,取交集为两个特征基因丝氨酸蛋白酶(HPN)、角蛋白23(KRT23),将两个基因在数据集GSE32571中进行验证,同时通过实时荧光定量聚合酶链反应在前列腺癌相关细胞系中进行验证,最后进一步分析了两个特征基因与免疫细胞浸润相关联系,两组间使用Student’s
t检验评估统计学意义。
结果:通过对GEO数据库3个前列腺癌数据集使用R语言及机器学习等方法进行分析,总共发现35个DEGs和两个核心基因,其中20个为下调基因,15个为上调基因。通过GO、KEGG、DO及GSEA通路分析发现这些基因富集在表皮细胞分化、角质形成等功能中,以细胞外基质受体相互作用及雌激素受体通路等信号上。通过套索算法(LASSO)及SVM筛选出的特征基因与数据集GSE32571进行检验,发现HPN、KRT23是前列腺癌的2个诊断生物标志物,在前列腺腺癌细胞系中mRNA水平进行验证符合生物信息分析结果,HPN在Du145、PC3、Vcap、Lncap、C4-2、22RV1组相对表达量(1.10±0.29、0.46±0.12、3.02±0.79、1.58±0.09,0.39±0.02,0.41±0.07)指标高于RWPE1组(0.09±0.01),差异有统计学意义(
t=6.000、5.030、6.400、27.980、15.600、6.870,
P<0.05),KRT23在Du145、PC3、Vcap、Lncap、C4-2、22RV1组相对表达量(0.42±0.01、0.15±0.03、0.15±0.02、0.15±0.03、0.62±0.09、0.04±0.01)指标低于RWPE1组(1.01±0.19),差异有统计学意义(
t=5.210、7.600、7.620、7.580、3.120、8.630,
P<0.05),且HPN、KRT23与免疫细胞相关,HPN与T细胞CD8、静息肥大细胞、静息树突状细胞呈负相关,与巨噬细胞M0呈正相关;KRT23与巨噬细胞M0呈负相关,与静息树突状细胞、静息肥大细胞呈正相关。
结论:HPN、KRT23可以作为前列腺癌的诊断性生物标志物,且HPN、KRT23与滤泡辅助性T细胞及调节性T细胞等免疫细胞相关。
文献关键词:
前列腺癌;生物信息学;机器学习;免疫浸润;诊断标志物
中图分类号:
作者姓名:
高文治;何宇辉;朱振鹏;张家锋;巩艳青;何世明;周利群;郭跃先;李学松
作者机构:
河北医科大学第三医院泌尿外科,石家庄 050051;北京大学第一医院泌尿外科 100034
文献出处:
引用格式:
[1]高文治;何宇辉;朱振鹏;张家锋;巩艳青;何世明;周利群;郭跃先;李学松-.基于生物信息学及机器学习算法筛选前列腺癌的关键表达基因及相关免疫细胞浸润分析)[J].中华实验外科杂志,2022(01):150-153
A类:
GSE69334,GSE32571,KRT23,雌激素受体通路,Du145,Vcap,Lncap,RWPE1
B类:
机器学习算法,前列腺癌,相关免疫,免疫细胞浸润,分析前,生物信息学方法,基因表达谱,GEO,下载,癌组织,信使,GSE46602,训练集,验证集,GSE69223,行合并,差异表达基因,DEGs,京都基因与基因组百科全书,基因本体论,DO,基因富集分析,GSEA,功能富集分析,Lasso,特征基因,交集,集为,丝氨酸蛋白酶,HPN,角蛋白,实时荧光定量聚合酶链反应,细胞系,相关联,Student,检验评估,言及,总共,核心基因,通路分析,表皮细胞,细胞分化,角质,细胞外基质,套索算法,LASSO,诊断生物标志物,前列腺腺癌,癌细胞,生物信息分析,PC3,C4,22RV1,相对表达量,标高,CD8,静息,肥大细胞,树突状细胞,巨噬细胞,M0,诊断性,滤泡,辅助性,调节性,免疫浸润,诊断标志物
AB值:
0.239154
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。