MMaction2深度解析：视频行为识别技术比较与应用场景

5星 · 超过95%的资源需积分: 17 3 浏览量更新于2024-08-04 收藏 69KB PPTX 举报

视频行为识别技术是一种复杂且重要的计算机视觉领域，它主要涉及对视频内容中的人或物体的行为进行理解和分析。本文将从三个主要类别来探讨这项技术：时序动作分类、时序动作检测和时空动作检测。 1. **时序动作分类（Action Classification）**：这是视频行为识别的基础，它关注的是对整个视频进行动作类别标签的分配，类似于视频内容的概括性理解。随着深度学习的发展，特别是模型如MMaction2，动作分类的准确性已经非常高，例如MMaction2在某些基准测试上的mAP（mean Average Precision）已超过90%，这表明其在大规模数据集上的性能卓越。 2. **时序动作检测（Temporal Action Detection）**：时序动作检测不仅要识别动作类别，还要定位动作发生的起止时间，通常以bounding box（边框）的形式表示动作区域。然而，由于检测过程中需要精确的时间窗口和边界，其性能受限制于Proposal生成的准确性和平均Proposal数量（AN）。OpenMMLab的MMaction2在时序动作检测任务上虽然能达到约70%的AR@100指标，但由于实际AN通常低于理论值，导致mAP在50左右徘徊，这对于实时监控等场景可能存在挑战。时序动作检测更适合用于事后分析，如分析比赛录像中的特定事件。 3. **时空动作检测（Spatial-Temporal Action Detection）**：这种方法不仅考虑动作类别和时间，还关注动作发生的具体空间位置。然而，它在识别起止时间和空间定位方面的准确性相对较低，导致在实时监控场景下不如时序动作检测。然而，当需要统计特定物体的行为频率，如计算通过闸门的人数，时空动作检测则更为适用。此外，对于动作持续时间较长或执行过程复杂的场景，如翻越障碍物，时空动作检测可能会遇到识别挑战，因为它可能只能捕捉到部分动作，这时时序动作检测可能更有优势。总结来说，视频行为识别技术的选择取决于应用场景的需求。如果需要精确的时间和空间定位，时空动作检测适合分析长时段行为，而时序动作检测在实时监控或快速找出特定动作片段方面更为合适。同时，动作分类作为基础，对于许多高级任务具有重要作用。在实践中，根据任务的精确度需求、实时性要求和数据特性，合理地组合和优化这些技术是关键。

注意点

实现原理概述典型算法

时序动作分类

相对来说没有那么复杂，就是在二维图片的基础上添加上时序这一三维信息，比如使用3D卷积来取得视频的

特征，最后加一个分类器

Slowfast、C3D等，

具体可参考

Mmaction2或者

https://paperswithcod

e.com

时序动作检测

最大的难题在于如何确定一段动作的起始时间和结束时间，总的来说借鉴的是faterrcnn系列的锚选框二段式

方法，只是给用到第三维的时序上了。就是用不同长度的滑动窗口，或者单独使用一层网络来预测起始、结

束点（BSN、BMN），这些时间段是proposal（即动作时段的提案），得出proposal之后再对这些时段进行

分类识别。

具体可参考

Mmaction2或者

https://paperswithcod

e.com

时空动作检测

正常来说比时序动作预测还多了对于运动物体（现在主要是人）的位置和该运动物体运动类别的判断。从

MMaction2来看，当前都是基于AVA数据集做的，模型也都是基于slowfast。但问题是slowfast是针对固定长

度窗口的检测（检测固定长度窗口的视频中的人的box位置，及该人在这一固定长度时间内的动作分类。并非

是计算每一帧人的box信息，而只是取了关键帧一般是中间帧中人的box信息，然后将该box信息在最后得到

的featuremap上进行截取并判定动作类别），所以一般来说slowfast的固定长度都比较小，要不然可能会导致

包含的动作过多。也就是说slowfast不能找到起始、结束时间点，而是只能识别出一段时间内的人的位置和动

作分类

具体可参考

Mmaction2或者

https://paperswithcod

e.com

剩余10页未读，继续阅读

weixin_38284256

粉丝: 1
资源: 6

MMaction2深度解析：视频行为识别技术比较与应用场景

Python-MMActionPyTorch开源视频行为识别工具包

公安视频图像分析系统：视频图像内容分析及描述技术要求.pdf

大华设备---人脸识别及行为分析

mmaction2 c3d

行为识别. 3d卷积视频分析

mmaction2 timesformer

mmaction2中要识别sit和stand用哪个模型好

在计算机视觉行为分析,基于计算机视觉的人眼行为识别算法分析

mmaction2 注意力机制

多模态行为识别现状分析

最新资源