典型文献
基于多组学数据的肿瘤药物敏感性预测
文献摘要:
肿瘤药物敏感性预测在指导患者临床用药方面具有重要意义.本文基于癌症药物敏感性基因组学数据库(genomics of drug sensitivity in cancer,GDSC)198种药物的细胞系敏感性IC50数据,通过Stacking集成学习构建了包含基因表达、基因突变、拷贝数变异数据的多组学癌症药物敏感性预测模型.采用多种特征选择方法对基因特征进行降维,使用Stacking方法集成6种初级学习器和1种次级学习器进行建模,采用5折交叉进行模型验证.预测结果中AUC大于0.9的占比为36.4%,在0.8-0.9之间的占比为49.0%,最低AUC为0.682.基于Stacking构建的多组学预测模型较已有单组学和多组学模型的准确性和稳定性具有优势.多组学整合预测药物敏感性优于单一组学.特征基因功能注释和富集分析解析了肿瘤对sorafenib潜在的耐药机制,从生物学角度提供了模型可解释性及其应用于临床用药指导的价值.
文献关键词:
集成学习;Stacking;特征选择;多组学;肿瘤耐药机制;sorafenib
中图分类号:
作者姓名:
杨晨雨;刘振浩;代培斌;张钰;黄鹏杰;林勇;谢鹭
作者机构:
上海理工大学健康科学与工程学院,上海200093;上海市生物医药技术研究院基因组与生物信息研究所,上海201203;中南大学湘雅医院,湖南长沙410008;同济大学医学院,上海200092
文献出处:
引用格式:
[1]杨晨雨;刘振浩;代培斌;张钰;黄鹏杰;林勇;谢鹭-.基于多组学数据的肿瘤药物敏感性预测)[J].生物工程学报,2022(06):2201-2212
A类:
B类:
多组学数据,药物敏感性预测,药方,基因组学数据库,genomics,drug,sensitivity,cancer,GDSC,细胞系,IC50,Stacking,集成学习,基因突变,拷贝数变异,异数,特征选择,选择方法,基因特征,方法集成,初级学习器,次级学习器,模型验证,特征基因,基因功能注释,功能注释和富集,富集分析,sorafenib,模型可解释性,临床用药指导,肿瘤耐药机制
AB值:
0.311616
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。