典型文献
基于真实数据感知的模型功能窃取攻击
文献摘要:
目的 模型功能窃取攻击是人工智能安全领域的核心问题之一,目的是利用有限的与目标模型有关的信息训练出性能接近的克隆模型,从而实现模型的功能窃取.针对此类问题,一类经典的工作是基于生成模型的方法,这类方法利用生成器生成的图像作为查询数据,在同一查询数据下对两个模型预测结果的一致性进行约束,从而进行模型学习.然而此类方法生成器生成的数据常常是人眼不可辨识的图像,不含有任何语义信息,导致目标模型的输出缺乏有效指导性.针对上述问题,提出一种新的模型窃取攻击方法,实现对图像分类器的有效功能窃取.方法 借助真实的图像数据,利用生成对抗网络(generative adversarial net,GAN)使生成器生成的数据接近真实图像,加强目标模型输出的物理意义.同时,为了提高克隆模型的性能,基于对比学习的思想,提出一种新的损失函数进行网络优化学习.结果 在两个公开数据集CIFAR-10(Canadian Institute for Advanced Research-10)和SVHN(street view house numbers)的实验结果表明,本文方法能够取得良好的功能窃取效果.在CIFAR-10数据集上,相比目前较先进的方法,本文方法的窃取精度提高了 5%.同时,在相同的查询代价下,本文方法能够取得更好的窃取效果,有效降低了查询目标模型的成本.结论 本文提出的模型窃取攻击方法,从数据真实性的角度出发,有效提高了针对图像分类器的模型功能窃取攻击效果,在一定程度上降低了查询目标模型代价.
文献关键词:
模型功能窃取;生成模型;对比学习;对抗攻击;人工智能安全
中图分类号:
作者姓名:
李延铭;李长升;余佳奇;袁野;王国仁
作者机构:
北京理工大学计算机学院,北京 100081
文献出处:
引用格式:
[1]李延铭;李长升;余佳奇;袁野;王国仁-.基于真实数据感知的模型功能窃取攻击)[J].中国图象图形学报,2022(09):2721-2732
A类:
模型功能窃取,模型窃取
B类:
真实数据,数据感知,人工智能安全,安全领域,目标模型,练出,类经,生成模型,法利,生成器,行约,模型学习,人眼,可辨,语义信息,出缺,有效指导,攻击方法,图像分类,分类器,图像数据,生成对抗网络,generative,adversarial,net,GAN,模型输出,物理意义,对比学习,损失函数,网络优化,优化学习,公开数据集,CIFAR,Canadian,Institute,Advanced,Research,SVHN,street,view,house,numbers,比目,数据真实性,对抗攻击
AB值:
0.347127
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。