首站-论文投稿智能助手
典型文献
面向图像修复的增强语义双解码器生成模型
文献摘要:
目的 图像修复技术虽然取得了长足进步,但是当图像中缺失区域较大时,非缺失区域提供的信息量非常有限,从而导致难以产生语义信息一致的内容来增强修复图像和真实图像的视觉一致性;同时图像修复常使用两阶段网络结构,基于该结构的模型不仅需要较长的训练时间,还会导致图像修复效果对第1阶段输出结果依赖性较强.针对上述问题,提出了一种基于双解码器的增强语义一致的图像修复方法.方法 使用双解码器网络结构消除两阶段修复方法中存在的依赖性问题,同时有效缩短模型的训练时间;利用一致性损失、感知损失和风格损失,更好地捕获图像的上下文语义信息,解决图像修复任务中出现的视觉不一致的问题.此外,本文使用了跳跃连接,并引入多尺度注意力模块和扩张卷积,进一步提高了网络的特征提取能力.结果 为了公正地评价,在Cele-bA、Stanford Cars和UCF Google Street View共3个数据集上对具有规则和不规则缺失区域的图像分别进行实验,采用客观评价指标:均方误差(L2)、峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity,SSIM)、FID(Fréchet inception distance)和IS(inception score)进行评价.实验结果表明本文方法修复的图像不仅在视觉上有明显的提升,而且取得了较优的数值.如规则缺失区域下,在CelebA数据集中,本文方法的FID(越小越好)比性能第2的模型在数值上减少了39.2%;在UCF Google Street View数据集中,本文方法的PSNR比其他模型在数值上分别提高了12.64%、6.77%、4.41%.结论 本文方法有效减少了模型的训练时间,同时消除了两阶段网络模型中的依赖性问题,修复的图像也呈现出更好的视觉一致性.
文献关键词:
图像修复;语义一致;双解码器;跳跃连接;多尺度注意力模块
作者姓名:
王倩娜;陈燚
作者机构:
南京师范大学计算机与电子信息学院/人工智能学院,南京 210023
引用格式:
[1]王倩娜;陈燚-.面向图像修复的增强语义双解码器生成模型)[J].中国图象图形学报,2022(10):2994-3009
A类:
双解码器网络,Cele
B类:
生成模型,图像修复技术,长足进步,缺失区域,信息量,语义信息,增强修复,视觉一致性,两阶段,训练时间,修复效果,输出结果,语义一致,修复方法,一致性损失,感知损失,上下文语义,复任,跳跃连接,多尺度注意力模块,扩张卷积,特征提取能力,Stanford,Cars,UCF,Google,Street,View,客观评价指标,均方误差,L2,峰值信噪比,peak,signal,noise,ratio,PSNR,结构相似性,structural,similarity,SSIM,FID,Fr,chet,inception,distance,IS,score,CelebA,越小越
AB值:
0.333388
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。