FAILED
首站-论文投稿智能助手
典型文献
基于多尺度视觉Transformer的图像篡改定位
文献摘要:
随着数字图像处理技术的不断发展,图像篡改不再局限于图像拼接等单一手段,而是通过图像编辑软件后处理隐藏恶意篡改痕迹,导致现有传统算法和基于深度学习的定位方法效果不佳.针对现有图像篡改算法定位精度不高的问题,文中提出了一种端到端基于多尺度视觉Transformer的图像篡改定位网络,该网络通过融合Transformer和卷积编码器来提取篡改区域与非篡改区域的特征差异,而多尺度视觉Transformer对不同尺寸图像块序列的空间信息进行建模,使得网络能适应各种形状大小的篡改区域.实验结果表明:所提出的算法在CASIA和NIST2016测试集上的F1分数分别为0.431和0.877,AUC值分别为0.728和0.971,相比当前的主流算法具有较为明显的性能提升;所提算法对JPEG压缩攻击具有较强的鲁棒性.
文献关键词:
深度学习;视觉Transformer;图像篡改;纵横注意力
作者姓名:
陆璐;钟文煜;吴小坤
作者机构:
华南理工大学 计算机科学与工程学院, 广东 广州510640
引用格式:
[1]陆璐;钟文煜;吴小坤-.基于多尺度视觉Transformer的图像篡改定位)[J].华南理工大学学报(自然科学版),2022(06):10-18
A类:
图像块序列,NIST2016,纵横注意力
B类:
Transformer,图像篡改,篡改定位,数字图像处理技术,图像拼接,一手,图像编辑,恶意,篡改痕迹,传统算法,定位方法,改算,定位精度,端到端,端基,卷积编码,编码器,改区,特征差异,不同尺寸,空间信息,CASIA,测试集,流算法,性能提升,JPEG
AB值:
0.333142
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。