GATN: 高斯时间感知网络提升长视频动作定位精度

需积分: 0 177 浏览量更新于2024-06-30 收藏 1.44MB DOCX 举报

在视频理解领域，准确地在视频中定位特定动作是一个关键且具有挑战性的任务。传统方法通常借鉴于图像对象检测技术，如SSD和Faster R-CNN，将其应用于动作的临时定位。然而，这些方法往往受限于预设的时间尺度，可能导致对动作时间结构的忽视，从而影响在复杂动作检测上的鲁棒性和实用性。为了克服这个问题，本文提出了一种新颖的框架——高斯时间感知网络（Gaussian Temporal Awareness Networks, GTAN）。GTAN的核心在于引入了高斯核来动态调整每个动作建议的时间尺度，以更好地捕捉动作的时间结构。这种网络设计在一个单一阶段的框架中整合了时间信息，与传统的单阶段动作定位方法（如图1所示）相比，其直观优势在于能够更灵活地探索动作的时间特性，而不仅仅是固定的特征图尺度。 GTAN主要由三个组成部分构成：（1）提议网络，它在长视频中识别潜在包含动作的片段，通过3D卷积神经网络（3D ConvNet）进行高效处理；（2）分类网络，学习多对一的动作分类模型，为定位网络提供初始预测；（3）定位网络，进一步微调分类网络，精确地定位每一个动作实例。作者还设计了一个特别的损失函数，该函数考虑了时间重叠，从而提高了定位的准确性。在实际应用中，GTAN展现出显著的优势。在墨西哥动作2（MexAction2）基准测试中，GTAN将mAP从1.7%提升到了7.4%，在THUMOS2014上，性能从15.0%提高到了19.0%。这些结果表明，通过考虑动作的时间结构和动态优化时间尺度，GTAN在处理长视频和复杂场景中的动作定位任务上取得了突破。总结来说，GTAN代表了一种创新的方法，它通过融合高斯核和深度学习技术，有效地解决了视频动作定位中的时间感知问题，特别是在处理长视频和动态动作时，展示了卓越的性能和鲁棒性。这种方法为视频理解领域的研究提供了新的视角和解决方案。

面临着将所有行动建议本地化的挑战

简而言之，我们的方法属于单阶段时间动作检测技术。与前面提到的通常预

先确定动作建议时间尺度的单阶段方法不同，本文中的GTAN不仅研究了通过高

斯核学习时间结构，还研究了如何更好地利用上下文信息进行动作定位。

Figure 2:

我们的高斯时间感知网络（

GTAN

）架构概述。通过

3D ConvNe

将输入视频编码

为一系列剪辑级特征，这些特征按顺序连接为特征图。两个

卷积层加上一个最大池层可以增

加感受野的时间大小。八个一维卷积层级联生成不同时间分辨率的多个特征图。在每个特征图

的顶部，在每个单元上学习高斯核，以预测动作建议的特定间隔。此外，将多个重叠度高的高

斯核混合到一个较大的高斯核中，以检测不同长度的长动作。通过高斯

池，行动建议是由高斯

曲线中的值加权的上下文单元的特征聚合而成。

GTAN

与行动分类损失加上两个回归损失共同优

化，即每个提案的本地化损失和重叠损失。

3. 高斯时间感知(Temporal Awareness)网络

在本节中，我们将详细介绍提议的(proposed)高斯时间感知网络（GTAN）。

图 2 说明了我们的动作定位架构的概述。

它由两个主要部分组成：一个基本特征网络和一个具有高斯核的一维时间卷积

层级联。基本特征网络是从连续视频片段中提取特征图，将其馈入级联的一维卷

积层以生成多个不同时间分辨率的特征图。对于一个特征图中的每个单元，学习

一个高斯核来控制与该单元相对应的动作提议的时间尺度，因为训练进行。此外，

设计了一种高斯核分组算法，将具有高重叠的多个高斯核合并到一个更大的核中，

以捕获具有任意长度的长动作。具体来说，每个动作提议都是通过聚合由高斯曲

线中的值加权的上下文单元的特征来生成的。整个网络通过动作分类损失和两个

回归损失联合优化，即定位损失和重叠损失，分别用于学习每个动作提议的动作类

别标签、默认时间边界调整和重叠置信度得分。

剩余18页未读，继续阅读

书看不完了

粉丝: 27

GATN: 高斯时间感知网络提升长视频动作定位精度

PyPI概率统计库probability_gaussian_binomial发布0.3版本

Python概率分布库：二项分布与高斯分布实现

Windows环境下使用MATLAB模拟大数值孔径透镜聚焦

Gaussian_propagation.rar_Gaussian_propagation_gaussian beam_三维高斯

gabor11create.rar_gabor_gaussian filter_gaussian_filter

gaussian.zip_add noise to image_gaussian_gaussian noise_消除高斯噪声_高

denoise.rar_ Gaussian denoise_denoise_gaussian denoise_椒盐噪声_椒盐噪声

Uart2Sdram2TFT_gaussian_filter.zip_Gaussian fpga_TFT_boyaj1_fpga

OpenMP_exercise.rar_SUM_gaussian_parallel gaussian_prefix_并行算法

Gaussian.rar_gaussian_matlab gaussian_matlab image_transform_tra

最新资源