零镜头跨域视频异常检测：未来帧预测新方法

47 浏览量更新于2024-06-20 收藏 1.26MB PDF 举报

"本文主要探讨了零镜头跨域视频异常检测（zxVAD）的未来帧预测模型，这是一种无需目标域适应的新框架。传统的跨域视频异常检测假设有些与任务相关的目标域训练数据可用于源域到目标域的自适应，但这种假设可能导致用户需要进行模型调优。zxVAD则提出了一种新方法，通过未来帧预测生成模型来学习正常事件的特征，并生成伪异常示例以训练模型，这种方法不需要额外的训练成本。" 在zxVAD框架中，关键创新点包括： 1. **未来帧预测模型**：与传统未来帧预测模型不同，zxVAD模型引入了一个新的正常分类器模块。这个模块通过学习正常事件视频特征与伪异常示例特征的相对差异，帮助模型理解正常事件的特性。 2. **异常合成模块**：利用未训练的卷积神经网络（CNN），zxVAD能在正常视频帧中添加异物，生成伪异常示例。这种方法减少了对额外训练数据的需求，降低了训练成本。 3. **相对正常特征学习策略**：这一策略允许zxVAD在没有目标域适应的情况下在新目标域中泛化，有效区分正常和异常帧。 4. **性能优势**：zxVAD在常见的视频异常检测数据集上表现出优于最新技术水平（SOTA）的结果，无论源训练数据是否与任务相关。此外，zxVAD在推理时间效率方面也超过了SOTA方法，包括模型大小、总参数数量、GPU能耗和GMAC等指标。 5. **无监督跨域视频异常检测**：无监督VAD方法因其无需异常事件的训练视频而受到青睐，特别是在安全和监控领域。然而，跨域设置增加了挑战，因为需要适应目标域。zxVAD解决了这一问题，无需目标域适应，适用于更严格的实际情况。 6. **问题背景**：现有的跨域VAD方法通常假设可以获取少量目标域训练数据，而zxVAD则放松了这一假设，使用零镜头方法处理更为实际的情况。 zxVAD提供了一种高效且实用的解决方案，不仅提高了视频异常检测的准确性，还减轻了用户在模型调优上的负担，为实际应用提供了便利。

2582

不

图2：框架概述。我们的zxVAD框架包含由我们的正常

分类器模块（

右

）指导的未来帧预测主干（左上）。为了强制预测骨干从源

域正常视频中学习可概括的特征并避免过拟合，我们鼓励生成模型使用四个新的损失函数来学习相对于伪异常帧的正常特征。这些异常

帧是使用未经训练的随机初始化CNN通过我们的新颖异常合成模块O（

左下

）创建的。

在VAD和TI视频帧上（

即

，

和

）。为了简洁起

见，我们将输入帧称为x。给定输入帧

∈

，我们把

CNNR

（

）

（在分类层之前）的

输出表示为张量G ∈

×h×w

例如

，如果

（

）

是

ResNet152[

]

，

则

是具有

如果输入大小为

256

，则大小为

2048

。我们

采用

SCDA [76]

对

执行通道求和，以获得

注意力图A∈Rh

×w

。然后我们得到一个二进制掩码

从

如下。如果

> 0，则设

1，或

图

：伪异常示例。我们发现假异常

使用我们的伪异常合成策略创建的帧（标记为（b））未经

训练的随机初始化

CNN

是

ResNet50 [75]

，它定位

帧中的对象

（标记为（a））。我们还表明

（i，j）

地面真实掩模

的

示例

用于损失

RAA

（标记为

（c））。

否则，请执行以下操作。这里，（i

，

j）表示h×w位置

中的位置

我们根据经验设置

了

。

一、

（

，

）

=1表示前景

对

象。最后，

从h

w调整为H

W。正如在[77]中所指

出的，这个令人惊讶的属性背后的想法是随机的，

更多示例见补充材料。

正常帧与异常帧不同（反之亦然）。为了清楚起见，

我们去掉预测帧的下标

初始化的

CNN

可以定位对象的原因是：因为背景

T+

并将其标记为

。这是一个不正常的分布，

在输入帧

中，与场景中的前景对象相比，这些背景区

域具有更高的机会被非线性去激活。

类似于

ReLU

的激活函数

[78]

。最后，该物体被定位

为

。创建伪异常帧

伪异常框架分别表示为

和

。

常态损失L

。给定预测的未来帧v和伪异常帧

，

使

用以下损失函数优化

（

）

以

增加v为

“正常”（标记

为1）和

为“异常”（标记为0）

的

概率

因此

，我们将

和输入帧s的

组合到

（

）

，

即

，、

。

∈

{

，

···

，

}

通过粘贴

对v

在随机位置

（

）

−

（

）

（

二

）

，大小随机

。我们讨论了方法的选择

补充材料中的位置

和尺寸

请注意，用于创建伪

视频帧的大多数视频帧都是

异常恰好包含至少一个前景对象，供未经训练的CNN

提取。即使没有这样的对象，

我们未经训练的

CNN

仍然

会关注一些补丁（在输入

帧上），并将它们视为正常事

件VAD帧上的异常

3.2.

学习常态w.r.t.异常

相对正常度损失

。

异常事件可以被视为相对于正常

事件的偏差我们认为

（

）的关键缺失属性是正态数据的

概率

正常

（

））应该随着

异常数据正常

（

）

的概

率

减小而增加，反之亦然。R

是使

[

isnormal

]

最

大

化的函

数，我们设

（

）

为最

大化P

[

isnormalthan

]

（

[

]

表

示概率

算子

）.我们将这种新的相对正常度损失定义如

下：

我们的正规分类器模块是一个分类器

（

）

，它是最优

的，

。

（

）

−

[

（

）

]

−

<$2

由以下四个损失函数组成这些损失函数

相互补充如下：正常

性

损失和

注意肯定

损失关注的是

正常框架和异常框架之间的差异，而

相对正常性

损失

和

相对注意肯定

损失则关注的是如何相对

不

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

零镜头跨域视频异常检测：未来帧预测新方法

H5的video标签跨域.HTML的video标签跨域_跨域ajax

Android移动应用跨域攻击检测.pdf

h5截取视频当前一帧图片

2022跨域目标检测

js 跨域连接视频下载

flv.js 跨域视频播放不了

跨域飞行器通用动力学模型建立

postman检测接口是否支持跨域

MediaElement.js 跨域请求视频播放

vue 视频地址跨域

最新资源