典型文献
基于蛋白质序列的氨基酸字母表简化
文献摘要:
蛋白质的结构和功能特性由其氨基酸序列编码,控制序列结构映射的规则被认为是二级遗传密码,氨基酸字母表的简化可以减少蛋白质序列中的冗余,有助于揭示编码规则.基于氨基酸的单体特征、成对相互作用和相似性,可以简化氨基酸字母表.目前,仅基于蛋白质的序列信息,根据最近邻氨基酸的出现频率构建了一个氨基酸的嵌入表示.在此基础上,提出一种通过重构最近邻氨基酸的出现频率来压缩嵌入表示的模型,将此方法命名为AA2Vec.实验结果表明,与其他表示维相比,特定表示维(三维)具有显著的鲁棒性.提取的信息捕捉了氨基酸的物理化学和生化特性以及最近邻氨基酸之间的相互作用.值得注意的是,提出的方法对于具有不同序列标识的序列数据集(SCOPe)是稳定的.这种方法给出了氨基酸的最简表示,有助于生成蛋白质序列的简化表示和建立蛋白质的简化模型.
文献关键词:
序列信息;氨基酸相互作用;AA2Vec;氨基酸字母表
中图分类号:
作者姓名:
张鑫鹏;王骏;王炜
作者机构:
南京大学物理学院,南京,210093
文献出处:
引用格式:
[1]张鑫鹏;王骏;王炜-.基于蛋白质序列的氨基酸字母表简化)[J].南京大学学报(自然科学版),2022(01):103-114
A类:
氨基酸字母表,AA2Vec,SCOPe
B类:
蛋白质序列,结构和功能,功能特性,氨基酸序列,列编,控制序列,序列结构,遗传密码,少蛋,编码规则,化氨,序列信息,最近邻,嵌入表示,物理化学,生化特性,值得注意,序列数据,简表,成蛋白,简化模型,氨基酸相互作用
AB值:
0.250858
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。