FAILED
首站-论文投稿智能助手
典型文献
基于深度学习识别RiPPs前体肽及裂解位点
文献摘要:
得益于基因测序技术的快速发展,基因组测序数据呈现爆炸式增长,核糖体合成和翻译后修饰肽(RiPPs)是近十年逐渐进入人们视野的一大类肽类天然产物.这类化合物在自然界中分布极其广泛,具有丰富的结构多样性和生物活性多样性,是天然药物的重要来源.RiPPs的发现主要依赖低通量生物实验,传统方法精确但成本高昂,随着新型计算机技术的更新迭代,包括antiSMASH、RiPP-PRISM等在内的生物信息学工具能够极大加速RiPPs挖掘进程,但依然无法突破基于同源性方法(例如搜索保守的生物合成酶)的限制——无法有效识别具有不同生物合成机制的新型RiPPs.在这里,本文首次基于自然语言处理预训练模型BERT,提出四种可以完全依赖序列数据识别RiPPs而非基于同源性及基因组上下文信息的深度学习模型,通过对各模型进行验证分析和对比,最终确定在RiPPs识别赛道上表现卓越的最佳模型BERiPPs(bidirectional language model for enhancing the performance of identification of RiPPs precursor peptides).BERiPPs能够在不考虑基因组背景的情况下以无偏见的方式识别RiPPs前体肽,并可通过条件随机场生成对前导肽裂解位点的预测,为高通量挖掘全新RiPPs提供了思路,并在一定程度下揭示了前体肽和修饰酶间的生物学底层关系.
文献关键词:
深度学习;RiPPs;前体肽;预训练模型;天然产物挖掘
作者姓名:
吕靖伟;邓子新;张琪;丁伟
作者机构:
上海交通大学生命科学技术学院,微生物代谢国家重点实验室,上海 200030;复旦大学化学系,上海 200243
文献出处:
引用格式:
[1]吕靖伟;邓子新;张琪;丁伟-.基于深度学习识别RiPPs前体肽及裂解位点)[J].合成生物学,2022(06):1262-1276
A类:
RiPP,BERiPPs,无偏见,天然产物挖掘
B类:
前体肽,基因测序技术,基因组测序,序数,爆炸式,核糖体,翻译后修饰,肽类,类化合物,结构多样性,天然药物,低通量,生物实验,高昂,计算机技术,antiSMASH,PRISM,生物信息学工具,大加,掘进,同源性,合成酶,别具,生物合成机制,自然语言处理,预训练模型,BERT,序列数据,数据识别,上下文信息,深度学习模型,验证分析,赛道,bidirectional,language,model,enhancing,performance,identification,precursor,peptides,条件随机场,前导
AB值:
0.302258
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。