时态结构挖掘：弱监督动作检测新进展

34 浏览量更新于2024-06-20 收藏 881KB PDF 举报

"本文主要探讨了时态结构挖掘（TSM）在弱监督动作检测中的应用，这是一种新的解决视频中动作实例识别的方法。与传统的全监督动作检测不同，TSM无需帧级注释，而是利用视频片段之间的时序关系来识别和定位动作。通过将每个动作实例建模为多阶段过程，TSM能够更好地处理具有潜在时间结构的动作实例。文中提到了阶段过滤器的概念，用于计算每个阶段存在的置信度分数，尽管在WSAD任务中缺少帧级注释，但通过巧妙的设计，仍能训练阶段滤波器。此外，文章还比较了TSM与现有方法SMS的差异，指出TSM引入的背景阶段能够有效地处理包含多个动作实例的视频。实验结果显示，TSM在三个基准数据集上表现出色，证明了其有效性和实用性。" 本文的研究背景是深度学习在视频剪辑动作识别任务上的成功，但这种方法对于未剪辑视频中的动作实例检测并不适用，因此转向了动作检测任务。在弱监督动作检测（WSAD）中，由于缺乏帧级注释，大多数方法难以捕捉到视频片段间的时间关联和复杂动作实例。作者提出的TSM方法则解决了这一问题，通过建模时间结构并使用阶段过滤器，能够在无帧级注释的情况下进行动作检测。 TSM的关键创新点在于它不仅考虑了动作的开始、中间和结束阶段，还引入了背景阶段，使得模型能够处理包含多个连续动作的视频片段。相比其他如SMS的方法，TSM的这种方法更具有普适性，能够同时识别并定位多个动作实例。实验部分，作者在多个基准数据集上验证了TSM的有效性，证明了即使在弱监督的条件下，TSM也能实现良好的动作检测性能。这些结果为未来的视频分析和理解提供了新的思路，尤其是在注释资源有限的情况下。 "时态结构挖掘：弱监督动作检测的新方法"为视频分析领域提供了一种新的、有效的工具，通过挖掘时间结构来提升动作检测的精度和效率，对于弱监督学习和视频理解研究具有重要价值。

4321

5525

3.3.

相位滤波器学习

如果没有帧级动作注释，学习相位滤波器比其

完全监督的计数器要困难得多[47，46]。我们观察

到滤波器学习依赖于发现的最大路径，同时最大路

径发现依赖于预先训练的相位滤波器。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

时态结构挖掘：弱监督动作检测新进展

2003年时态数据挖掘：基于频繁项集的方法与应用

时态路径约束关联规则挖掘：网络业务分析新方法

时态社交网络：群组查询处理

时态社交网络：存储，索引和查询处理

时态关联规则挖掘：数据挖掘技术与SPSS-Clementine实战

时态关联规则挖掘：一种基于频繁项集树的新算法

时空数据中意外模式挖掘：基于时态逻辑的方法

时态黑盒模型：特征重要性分析与解释方法

注意力时态GCN：动态图中异常检测的新突破

时态数据库研究：偏序时态模式与多值依赖

最新资源