频域模拟攻击:增强对抗样本的新型策略

0 下载量 51 浏览量 更新于2024-06-19 收藏 2.39MB PDF 举报
本文主要探讨了频域模型增强在对抗性攻击中的新应用,针对深度神经网络(DNN)在计算机视觉领域的广泛应用中所面临的鲁棒性挑战。对抗性攻击是指对正常输入进行微小扰动,使得经过深度学习模型处理后,预测结果出现错误。传统上,黑盒攻击下,替代模型与受害模型之间的性能差距较大,导致攻击效果相对较弱且对抗样本的可移植性不强。 作者提出了利用频谱模拟攻击来解决这一问题,通过在频域内执行模型增强,创造更多可转移的对抗性样本。他们主张,通过频谱变换输入,能够产生显著不同的模型反应,进而反映替代模型的多样性。这种方法理论上证明了频域变换会导致不同于空间域的频谱显著图,成为衡量模型多样性的有效指标。 文章的关键创新在于引入频域操作,它不仅提升了对抗性样本的攻击性能,还增强了它们的可移植性。实验结果显示,在ImageNet数据集上,使用该方法对抗九种先进的防御模型,平均成功率高达95.4%,显示出显著的效果。此外,该方法可以与现有攻击策略结合使用,具有广泛的适用性和灵活性。 这篇论文提供了一种有效的方法来对抗深度学习模型的对抗性攻击,通过频域模型增强,显著提高了攻击的效率和可移植性,这对于提升人工智能系统的安全性具有重要意义。读者可以通过访问提供的GitHub代码库进一步了解和实践这一技术。