首站-论文投稿智能助手
典型文献
结合多尺度卷积胶囊网络的植物lncRNA编码小肽预测
文献摘要:
长非编码RNA(lncRNA)是一类不编码蛋白、长度大于200 nt的非编码RNA.然而,最近研究表明,部分lncRNA中含有不超过300 nt的短开放阅读框(sORFs),具备编码小肽的能力.这一发现使得sORFs编码小肽(SEPs)这一崭新的研究领域引起人们的重视.目前,对SEPs的研究大多采用生物实验和传统机器学习方法.由于生物实验方法造价高、耗时长、传统机器学习涉及过多人工干预,提出一种结合多尺度卷积胶囊网络的深度学习模型,既能够充分提取序列特征,又通过胶囊间的连接进行特征聚类.采用五折交叉验证评估模型性能,在苔藓数据集上与单一深度学习模型和简单融合深度学习模型相比,取得较好的分类效果.另外,采用拟南芥、大豆两个物种的数据集进行独立测试,验证了模型具有良好的泛化能力.
文献关键词:
胶囊网络;长非编码RNA;短开放阅读框;小肽;预测
作者姓名:
胡鹤还;孟军;赵思远;纪腾其
作者机构:
大连理工大学计算机科学与技术学院 辽宁大连 116023
引用格式:
[1]胡鹤还;孟军;赵思远;纪腾其-.结合多尺度卷积胶囊网络的植物lncRNA编码小肽预测)[J].郑州大学学报(理学版),2022(01):12-18
A类:
sORFs
B类:
多尺度卷积,胶囊网络,lncRNA,小肽,长非编码,编码蛋白,nt,短开放阅读框,一发,SEPs,生物实验,机器学习方法,实验方法,价高,人工干预,深度学习模型,分提,提取序列,序列特征,接进,特征聚类,五折交叉验证,验证评估,模型性能,苔藓,分类效果,拟南芥,大豆,泛化能力
AB值:
0.356322
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。