首站-论文投稿智能助手
典型文献
基于卷积神经网络的大肠杆菌启动子预测
文献摘要:
目的 基于位点特异性打分矩阵(position-specific scoring matrices,PSSM)的预测模型已经取得了良好的效果,基于PSSM的各种优化方法也在不断发展,但准确率相对较低,为了进一步提高预测准确率,本文基于卷积神经网络(convolutional neural networks,CNN)算法做了进一步研究.方法 采用PSSM将启动子序列处理成数值矩阵,通过CNN算法进行分类.大肠杆菌K-12(Escherichia coli K-12,E.coli K-12,下文简称大肠杆菌)的Sigma38、Sigma54和Sigma703种启动子序列被作为正集,编码(Coding)区和非编码(Non-coding)区的序列为负集.结果 在预测大肠杆菌启动子的二分类中,准确率达到99%,启动子预测的成功率接近100%;在对Sigma38、Sigma54、Sigma70 3种启动子的三分类中,预测准确率为98%,并且针对每一种序列的预测准确率均可以达到98%以上.最后,本文以Sigma38、Sigma54、Sigma703种启动子分别和Coding区或者Non-coding区序列做四分类,预测得到的准确性为0.98,对3种Sigma启动子均衡样本的十交叉检验预测精度均可以达到0.95以上,海明距离为0.016,Kappa系数为0.97.结论 相较于支持向量机(support vector machine,SVM)等其他分类算法,CNN分类算法更具优势,并且基于CNN的分类优势,编码方式亦可以得到简化.
文献关键词:
大肠杆菌;位点特异性打分矩阵;卷积神经网络;多分类
作者姓名:
彭宝成;张晓炜;刘暘;樊国梁
作者机构:
内蒙古大学物理科学与技术学院,呼和浩特010021;内蒙古医科大学第一附属医院风湿免疫科,呼和浩特010050
引用格式:
[1]彭宝成;张晓炜;刘暘;樊国梁-.基于卷积神经网络的大肠杆菌启动子预测)[J].生物化学与生物物理进展,2022(07):1334-1347
A类:
位点特异性打分矩阵,PSSM,Sigma38,Sigma54,Sigma703,Sigma70
B类:
大肠杆菌,position,specific,scoring,matrices,预测准确率,convolutional,neural,networks,启动子序列,列处理,Escherichia,coli,Coding,非编码,Non,coding,二分类,三分类,四分类,交叉检验,海明距离,Kappa,support,vector,machine,分类算法,编码方式,多分类
AB值:
0.229402
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。