典型文献
基于组蛋白修饰数据预测基因差异性表达的深度融合模型
文献摘要:
针对使用大规模组蛋白修饰(HM)数据预测基因差异性表达(DGE)时未合理利用细胞型特异性(CS)和细胞型间异同两类信息,且输入规模大、计算量高等问题,提出一种深度学习方法dcsDiff.首先,使用多个自编码器(AE)和双向长短时记忆(Bi-LSTM)网络降维,并建模HM信号得到嵌入表示;然后,利用多个卷积神经网络(CNN)分别挖掘每类CS的HM组合效应以及两细胞型间每种HM的异同信息和所有HM的联合影响;最后,融合两类信息预测两细胞型间的 DGE.在对REMC数据库中10对细胞型的实验中,与DeepDiff相比,dcsDiff的预测DGE的皮尔逊相关系数(PCC)最高提升了7.2%、平均提升了3.9%,准确检测出差异表达基因的数量最多增加了36、平均增加了17.6,运行时间节省了78.7%;进一步的成分分析实验证明了合理整合上述两类信息的有效性;并通过实验确定了算法的参数.实验结果表明dcsDiff能有效提高DGE预测的效率.
文献关键词:
组蛋白修饰;基因差异性表达;细胞型特异性;自编码器;双向长短时记忆网络;信息融合;表观遗传学
中图分类号:
作者姓名:
李昕;贾韬
作者机构:
西南大学 计算机与信息科学学院,重庆 400715
文献出处:
引用格式:
[1]李昕;贾韬-.基于组蛋白修饰数据预测基因差异性表达的深度融合模型)[J].计算机应用,2022(11):3404-3412
A类:
基因差异性表达,细胞型特异性,dcsDiff,REMC,DeepDiff
B类:
组蛋白修饰,数据预测,融合模型,模组,HM,DGE,CS,入规,计算量,深度学习方法,自编码器,AE,Bi,嵌入表示,每类,组合效应,联合影响,信息预测,皮尔逊相关系数,PCC,出差,差异表达基因,运行时间,双向长短时记忆网络,信息融合,表观遗传学
AB值:
0.207285
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。