关系网络驱动的动作识别新方法:ACRN在时空行为中的突破
124 浏览量
更新于2024-06-20
收藏 1.67MB PDF 举报
"以行动者为中心的关系网络:动作识别的新方法"这篇文章探讨了在当前先进的时空动作定位领域中的一个关键突破。传统的时空动作识别模型主要依赖于帧级别的检测和三维卷积神经网络(3D ConvNets),这些方法往往无法充分捕捉人类演员、相关对象和场景元素之间的互动,从而导致动作分类性能受限。文章的创新之处在于提出了一种名为演员为中心的关系网络(ACRN)的弱监督学习方法。
ACRN的核心思想是通过构建和分析演员与环境中的动态关系,而非单纯依赖于个体的视觉特征。它不仅关注演员自身的运动,还关注与之互动的物体和场景元素,这有助于区分相似的动作。该模型通过计算和整合演员与全局场景的功能关系,生成动作分类所需的深层次关系特征。这种方法被设计为神经网络结构,能够在训练时与现有的动作检测系统协同工作。
通过在大规模、多样化和真实数据集如JHMDB和AVA上的实验,研究者证明了ACRN在关系信息捕捉和提升性能方面的优越性。与先前的方法相比,ACRN不仅可以提供更准确的动作识别,而且其可视化的关系学习功能展示了它能有效地解析动作中的相关关系。例如,图1中的例子表明,识别像接球和投篮这样的复杂动作,仅依赖单个演员的视觉信息是不足以的,需要理解他们在空间和时间上的交互关系。
这篇文章强调了关系网络在动作识别中的重要性,尤其是当处理涉及多个参与者的动态场景时。通过引入ACRN,研究者们朝着更深入地理解人类行为理解迈出了重要一步,这对于机器人技术、安全监控和健康领域等应用具有显著的实际价值。"
2021-09-19 上传
246 浏览量
2022-08-04 上传
137 浏览量
122 浏览量
129 浏览量
2024-11-11 上传
2024-10-28 上传
2024-11-01 上传