典型文献
基于生成对抗网络的基因数据生成方法
文献摘要:
在深度学习中,随着卷积神经网络(CNN)的深度不断增加,进行神经网络训练所需的数据会越来越多,但基因结构变异在大规模基因数据中属于小样本事件,导致变异基因的图像数据十分匮乏,严重影响了CNN的训练效果,造成了基因结构变异检测精度差、假阳性率高等问题.为增加基因结构变异样本数量,提高CNN识别基因结构变异的精度,提出了一种基于生成对抗网络(GAN)进行基因图像数据扩增的方法——GeneGAN.首先,利用Reads堆叠方法生成初始基因图像数据,将变异基因图像数据与非变异基因图像数据分为两个数据集;然后,为了平衡正负样本数据集,使用GeneGAN对变异图像样本进行扩充;最后,通过CNN对平衡前后数据集进行检测,并对精确率、召回率与F1值进行对比.实验结果显示,与传统扩增方法、生成对抗网络扩增方法、特征提取方法相比,GeneGAN对基因结构变异检测的F1值提升了1.94~17.46个百分点,说明使用GeneGAN进行基因数据生成能够有效提高使用CNN进行基因图像分类的精确率.
文献关键词:
生成对抗网络;残差学习;基因图像;卷积神经网络;数据增强
中图分类号:
作者姓名:
曹一珉;蔡磊;高敬阳
作者机构:
北京化工大学信息科学与技术学院,北京100029
文献出处:
引用格式:
[1]曹一珉;蔡磊;高敬阳-.基于生成对抗网络的基因数据生成方法)[J].计算机应用,2022(03):783-790
A类:
基因图像,GeneGAN
B类:
生成对抗网络,基因数据,数据生成,生成方法,神经网络训练,基因结构,结构变异,异在,小样本,本事,异基因,图像数据,训练效果,变异检测,检测精度,假阳性率,异样,样本数量,数据扩增,Reads,堆叠,始基,正负样本,样本数据集,异图,像样,精确率,召回率,增方,百分点,图像分类,残差学习,数据增强
AB值:
0.240989
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。