利用对抗性扰动增强视频鲁棒性的深度学习方法

141 浏览量更新于2024-06-20 收藏 815KB PDF 举报

"本文主要探讨了如何通过引入对抗性扰动来增强视频的鲁棒性，以提升视频分类的准确性。研究中，作者利用对抗性扰动对深度学习模型进行训练，以创建更为稳健的视频表示。具体方法是，首先针对每一帧的视频识别深度模型生成对抗性样本，然后构建二元分类问题，学习一组判别超平面来区分原始特征与对抗性扰动后的特征。这些超平面构成的子空间被用作视频的描述符，称为判别子空间池化。这种方法能够提取出更具代表性的特征，从而提高模型对视频数据的鲁棒性。文章指出，尽管深度学习在计算机视觉领域取得了显著进步，尤其是在图像处理方面，但在视频识别任务中仍面临挑战。视频数据的时序性和复杂性使得模型设计和训练更为复杂。常见的解决方案包括使用循环深度架构或3D卷积滤波器，但这些方法受限于硬件性能和固定的时间感受野。相比之下，递归神经网络如LSTM和GRU虽有潜力，但在实际应用中的表现仍不如基于部分视频的模型。在文章的实验部分，作者在多个视频数据集上验证了他们的方法，展示出了超越现有先进技术的结果。他们提出了一种在Stiefel流形上学习子空间的目标，并利用黎曼优化技术有效解决这一问题。通过这种方式，他们能够在保持模型性能的同时，提高其对对抗性攻击的抵抗力。该文提出了对抗性扰动学习的新策略，以提升视频分类的鲁棒性，这对于视频识别领域的研究具有重要意义，特别是对于应对现实世界中的噪声和干扰，以及改进现有的深度学习模型具有实际应用价值。"

J. Wang和A. Cherian

相关工作

传统的视频学习方法使用手工制作的特征（从几帧开始）

- 诸如密集轨迹、HOG、HOF等

。[52]-捕获外观和视频动态，并使用词袋表

示或更优雅地使用Fisher向量[38]对其进行总结。随着深度学习方法的

成功，将视频数据作为RGB帧、光流子序列、RGB差异或3D骨架数据

直接馈送到CNN是首选。一种成功的这种方法是双流模型（及其变

体）[42，18，17，27]，其使用（几帧的）视频片段来训练深度模

型，来自片段的预测经由平均池化融合以生成视频级预测。这种方法

也有一些扩展，可以以端到端的方式直接学习模型[17]。虽然，这样

的模型是吸引人的捕捉视频动态，它需要存储器来存储整个序列的中

间特征图，这可能是不切实际的长序列。已经探索了循环模型[2，

13，14，31，46，57]来解决这个问题，它可以学习在通过它们流式传

输视频时过滤有用的信息，但它们通常很难训练[37];可能是由于需要

随着时间的推移反向传播。使用3D卷积核[8，50]是另一个被证明有

前途的想法，但带来了更多的参数。上述架构通常被训练用于提高分

类准确度，然而，不考虑其内部表示的鲁棒性-考虑到这一点可以提高

其对看不见的测试数据的可推广性。为此，我们探索模型中的脆弱因素

（通过生成对抗性扰动[35]），并以网络不可知的方式学习对这些因

素有弹性的表示。我们的主要灵感来自于Moosavi等人最近的工作。

[35]这表明存在准不可感知的图像扰动，可以欺骗训练有素的CNN模

型。他们提供了一个系统的程序来学习这种扰动的图像不可知论的方

式。在Xie et al.[56]中，这种扰动被用于提高物体检测系统的鲁棒性在

[34，36，58]中已经探索了类似的想法在Sun et al.[48]中，使用潜在模

型来显式地定位有区别的视频片段。在Chang et al.[9]中，引入了语义

池化方案，用于定位未修剪视频中的事件。虽然这些计划与我们的动

机相似，但问题设置和公式

完全不同

在我们的贡献的表示学习方面，有一些先前的池化方案在某种意

义上是相似的，它们也使用优化泛函的参数作为表示。最相关的工作

是rank-pooling及其变体[22，21，20，47，4，11，53]，其使用rank-

SVM来捕获视频时间演变。与我们类似，Cherian et al.[10]提出使用子

空间来表示视频序列。然而，这些方法中没有一个确保时间排序约束

是否捕获有用的视频内容或捕获一些时间变化的噪声。为了克服这个

问题，Wang等人[54]提出了一种使用支持向量机分类器的决策边界的

表示在本文中，我们在数据相关的设置中重新考虑这个问题

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

利用对抗性扰动增强视频鲁棒性的深度学习方法

模型的鲁棒性：对抗性示例作为输入，可提高鲁棒性。可以使用对抗性训练技术来提高模型的鲁棒性，使其能够更好地处理不同的输入数据。如何对抗性训练

Python-特征去噪提高对抗鲁棒性

对抗性扰动导向的领域适应方法

通用对抗性扰动论文实现指南与数据集配置教程

对抗性扰动对比学习在条件文本生成中的应用

无数据场景下利用类映像生成通用对抗性扰动的新型方法

对抗性鲁棒性工具箱0.7.0版本发布

对抗性鲁棒性工具箱1.6.1版本发布

对抗性鲁棒性工具箱1.5.2版本发布

深入理解对抗性鲁棒性工具箱0.1版本

最新资源