频域模拟攻击：增强对抗样本的新型策略

51 浏览量更新于2024-06-19 收藏 2.39MB PDF 举报

本文主要探讨了频域模型增强在对抗性攻击中的新应用，针对深度神经网络（DNN）在计算机视觉领域的广泛应用中所面临的鲁棒性挑战。对抗性攻击是指对正常输入进行微小扰动，使得经过深度学习模型处理后，预测结果出现错误。传统上，黑盒攻击下，替代模型与受害模型之间的性能差距较大，导致攻击效果相对较弱且对抗样本的可移植性不强。作者提出了利用频谱模拟攻击来解决这一问题，通过在频域内执行模型增强，创造更多可转移的对抗性样本。他们主张，通过频谱变换输入，能够产生显著不同的模型反应，进而反映替代模型的多样性。这种方法理论上证明了频域变换会导致不同于空间域的频谱显著图，成为衡量模型多样性的有效指标。文章的关键创新在于引入频域操作，它不仅提升了对抗性样本的攻击性能，还增强了它们的可移植性。实验结果显示，在ImageNet数据集上，使用该方法对抗九种先进的防御模型，平均成功率高达95.4%，显示出显著的效果。此外，该方法可以与现有攻击策略结合使用，具有广泛的适用性和灵活性。这篇论文提供了一种有效的方法来对抗深度学习模型的对抗性攻击，通过频域模型增强，显著提高了攻击的效率和可移植性，这对于提升人工智能系统的安全性具有重要意义。读者可以通过访问提供的GitHub代码库进一步了解和实践这一技术。

+v：mala2255获取更多论

文

→



′

对抗性攻击的频域模型增强

虽然对抗性训练是目前提高模型鲁棒性的最有效策略，但它不可

避免地遭受了耗时的训练成本，并且应用于大规模数据集和复杂DNN

时成本高昂为了避免这个问题，许多作品试图在馈送到DNN之前治愈

对抗性扰动的感染。Guo

等人。

[14]利用多个输入变换（

例如，

JPEG

压缩[7]，总方差最小化[33]和图像拼接[8]）以从对抗性扰动中恢复。

Liao

等人

[21]提出高级表示引导去噪器（HGD）来抑制对抗扰动的影

响。 Xie

等人

[51]通过随机填充和填充（R& P）减轻对抗效应。Cohen

等人。

[17]利用具有高斯数据增强的分类器来创建可证明鲁棒的分类

器。此外，研究人员还尝试将对抗训练和输入预处理方法的优点结合

起来，以进一步提高DNN的鲁棒性。NeurIPS-r3解决方案[41]提出了一

个两步程序，首先用一系列变换（

例如，

旋转、缩放和剪切），然后

将输出传递通过逆向训练的模型的集合以获得总体预测。 Naseer

等人

[29]设计一个神经表示净化器（NRP）模型，学习基于

自动生成的监督。

方法

在本节中，我们首先给出第二节中任务的基本定义3.1，然后介绍我

们的动机。3.2. 基于这种动机，我们提供了所提出的方法-频谱变换

（第二节）的详细描述3.3）。最后，我们介绍了我们的整体攻击算

法。三点四

3.1

预赛

形式上，令

：x

表示分类模型，其中

、x和

分别表示模型的参

数、输入干净图像和真实标签。我们的目标是设计一个对抗性扰动

，这样得到的对抗性示例x

′

x + δ就可以成功地误导分类器，

即

，

（x

′

）

（

a.k.a.

无针对性攻击）。为了确保输入的变化最小，对

抗性的例子应该是以x

为

中心，半径

为

的

-范数球。在文献[4，

53，5，10，46，47，9]的基础上，本文主要研究了范数的性质。因

此，对抗性示例的生成可以用公式表示为以下优化问题：

arg

（

′

，

;

）

，

s.t.

其中

（x

′

，

;

）通常是交叉熵损失。然而，直接优化Eq. 1通过受害

者模型

在黑盒方式下，因为它的参数

是不可访问的。为了克服这

一限制，一种常见的做法是通过可访问的替代模型

来制作对抗性示

例

剩余21页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

频域模拟攻击：增强对抗样本的新型策略

频谱模拟攻击（ECCV'2022Oral）以提高对抗性示例的可转移性.zip

双选择信道中FTN信令的基于图形模型的频域均衡

具有频域干扰抑制的新型星载宽带DBF天线

鲁棒轨迹聚类：对抗遮挡与噪声的运动分割方法

深度学习模糊文档图像恢复新方法：变换器模块和频域学习优化

联合时频分布与压缩感知：对抗频谱弥散干扰的关键技术

JPEG图像隐写分析：小波频域统计矩方法

RLS算法驱动的时变AR模型：语音增强新策略

基于PCA-CGAN的时频域特征样本生成模型

JPEG图像DCT域隐写分析：一种新型方法

最新资源