利用对抗性扰动增强视频鲁棒性的深度学习方法

0 下载量 141 浏览量 更新于2024-06-20 收藏 815KB PDF 举报
"本文主要探讨了如何通过引入对抗性扰动来增强视频的鲁棒性,以提升视频分类的准确性。研究中,作者利用对抗性扰动对深度学习模型进行训练,以创建更为稳健的视频表示。具体方法是,首先针对每一帧的视频识别深度模型生成对抗性样本,然后构建二元分类问题,学习一组判别超平面来区分原始特征与对抗性扰动后的特征。这些超平面构成的子空间被用作视频的描述符,称为判别子空间池化。这种方法能够提取出更具代表性的特征,从而提高模型对视频数据的鲁棒性。 文章指出,尽管深度学习在计算机视觉领域取得了显著进步,尤其是在图像处理方面,但在视频识别任务中仍面临挑战。视频数据的时序性和复杂性使得模型设计和训练更为复杂。常见的解决方案包括使用循环深度架构或3D卷积滤波器,但这些方法受限于硬件性能和固定的时间感受野。相比之下,递归神经网络如LSTM和GRU虽有潜力,但在实际应用中的表现仍不如基于部分视频的模型。 在文章的实验部分,作者在多个视频数据集上验证了他们的方法,展示出了超越现有先进技术的结果。他们提出了一种在Stiefel流形上学习子空间的目标,并利用黎曼优化技术有效解决这一问题。通过这种方式,他们能够在保持模型性能的同时,提高其对对抗性攻击的抵抗力。 该文提出了对抗性扰动学习的新策略,以提升视频分类的鲁棒性,这对于视频识别领域的研究具有重要意义,特别是对于应对现实世界中的噪声和干扰,以及改进现有的深度学习模型具有实际应用价值。"