关系网络驱动的动作识别新方法：ACRN在时空行为中的突破

12 浏览量更新于2024-06-20 收藏 1.67MB PDF 举报

"以行动者为中心的关系网络：动作识别的新方法"这篇文章探讨了在当前先进的时空动作定位领域中的一个关键突破。传统的时空动作识别模型主要依赖于帧级别的检测和三维卷积神经网络（3D ConvNets），这些方法往往无法充分捕捉人类演员、相关对象和场景元素之间的互动，从而导致动作分类性能受限。文章的创新之处在于提出了一种名为演员为中心的关系网络（ACRN）的弱监督学习方法。 ACRN的核心思想是通过构建和分析演员与环境中的动态关系，而非单纯依赖于个体的视觉特征。它不仅关注演员自身的运动，还关注与之互动的物体和场景元素，这有助于区分相似的动作。该模型通过计算和整合演员与全局场景的功能关系，生成动作分类所需的深层次关系特征。这种方法被设计为神经网络结构，能够在训练时与现有的动作检测系统协同工作。通过在大规模、多样化和真实数据集如JHMDB和AVA上的实验，研究者证明了ACRN在关系信息捕捉和提升性能方面的优越性。与先前的方法相比，ACRN不仅可以提供更准确的动作识别，而且其可视化的关系学习功能展示了它能有效地解析动作中的相关关系。例如，图1中的例子表明，识别像接球和投篮这样的复杂动作，仅依赖单个演员的视觉信息是不足以的，需要理解他们在空间和时间上的交互关系。这篇文章强调了关系网络在动作识别中的重要性，尤其是当处理涉及多个参与者的动态场景时。通过引入ACRN，研究者们朝着更深入地理解人类行为理解迈出了重要一步，这对于机器人技术、安全监控和健康领域等应用具有显著的实际价值。"

C. Sun等人

我们证明，增强一个国家的最先进的动作本地化方法与空间背景

产生显着的性能改善。

视觉中的背景在计算机视觉中，使用上下文信息来改善视觉识别

已经被广泛研究早期的工作表明，

上下文可以帮助场景分类[35]，

对象检测[15，17，33，39，53]和

图像中的动作识别[61]。在这些情

况下，上下文通常提供强先验，从而实现更鲁棒的识别。虽然这

些上下文模型主要是手工设计的，但最近的研究已经研究了如何

使用深度卷积网络学习上下文[46，47]。空间背景也已经在用于学

习无监督视觉表示的自监督学习中进行了研究[6，36]。除了图像

之外，还在视频中利用了上下文，特别是用于识别具有手工制作

的特征[32]和学习的表示[8，45]的动作虽然我们也有兴趣在识别人

类的行动与上下文，

本文重点介绍的作用，检测的背景。重要的是，

由于从作物中识别

动作即使对人类来说也是一个挑战，我们认为上

下文应该在学习强大的动作检测模型中发挥关键作用。

对对象之间的关系[38，31]以及更具体地人与对象之间的关系[12，

14]进行建模已经被示出为提高静态图像中的关系的识别性能最近的

工作[12]在V-COCO [14]和HIC 0- DET [4]上获得了人类动作对象识别的

最新性能。与我们的方法相反，他们的模型仅适用于静态图像，并且

依赖于对演员，动作和对象的全面监督，如V-COCO [14]和HICO-DET

[4]中所注释的。

基于角色中心关系网络

本节描述我们提出的动作检测框架。该框架建立在最近成功的深度学

习方法的基础上，用于从静态图像[40]和视频[37]中检测对象和动

作。我们注意到，感兴趣的演员和其他演员或对象之间的关系信息对

于识别动作很重要，但通常被最近的动作检测方法忽略[37，24];收集

这样的注释可能是耗时的，并且许多最近的动作识别数据集没有提供

这样的注释[26，13，48]。我们提出的框架的目的是明确建模的关

系，弱演员级的监督，以演员为中心的关系网络模块。一旦经过训

练，该框架不仅可以以更高的准确度检测人类动作，而且还可以为每

个演员和动作生成相关关系的空间热图该方法的概述可以在图2中找

到。

3.1

动作检测框架

我们的目标是将视频中的动作我们遵循基于帧的动作检测的流行范

式，其中模型产生针对

剩余16页未读，继续阅读

cpongm

粉丝: 6

关系网络驱动的动作识别新方法：ACRN在时空行为中的突破

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

agenda_3cd_01_0716.pdf

A课件Python全栈开发线下班.zip

diminico_02_1108.pdf

基于人工智能大模型技术的果蔬农技知识智能问答系统.pdf

diminico_02_0307.pdf

最新资源