视频理解：时间动作检测器错误分析与诊断

58 浏览量更新于2024-06-20 收藏 1.22MB PDF 举报

"本文主要讨论了在时间动作检测器中诊断和分析错误的重要性，特别是在视频理解领域的挑战。作者提出了一种新的诊断工具，用于评估和比较不同方法在时间动作检测上的性能，超越了单一的度量标准。通过对ActivityNet动作本地化挑战赛中的获奖算法进行分析，研究揭示了关键问题集中在时间上下文处理、实例大小的鲁棒性以及定位误差的减少上。同时，研究表明，注释者之间的不一致性并非主要障碍。此公开的诊断工具为其他研究者提供了深入理解其算法的途径，有助于推动时间动作检测技术的发展。文章还提到了视频理解的当前状态，包括表示学习的进步和大规模数据集的出现，但强调在长时间未修剪视频中的动作定位仍存在挑战。" 在介绍部分，作者指出视频理解领域的快速发展，特别是在图像表示学习和大规模数据集的推动下。尽管有一些进展，但精确地在时间轴上定位长视频中的动作仍然是一个待解决的问题。为了更好地理解这一问题，他们提出了一个诊断工具，专注于时间动作检测器的性能分析。通过分析ActivityNet挑战赛的领先方法，作者发现了几个关键问题。首先，正确处理实例周围的时间上下文对于提高检测器的性能至关重要。其次，算法需要增强对动作实例绝对和相对大小变化的鲁棒性，因为这直接影响检测准确性。最后，减少定位误差的策略也是提高整体性能的重要因素。此外，作者的实验结果显示，标注不一致性并不是限制领域进步的主要原因。这意味着更多的关注应放在算法设计和改进上，而不是过分担忧数据标注的质量问题。这个诊断工具的开放性允许其他研究者利用它来深入理解他们的算法，从而促进整个领域的进步。在结论中，作者强调了他们的工作作为为未来时间动作本地化提供正确方向的一种手段。通过深入分析现有方法的弱点，研究者可以更有针对性地开发新算法，有望实现视频中动作定位的突破。

H. Alwassel

等人

（

）

（

）

表1：通过平均mAP和平均mAP N测量的定位性能

在ActivityNet上[4]。我们显示了所

有预测和前10个G预测的两个指标

，其中G是地面实况实例的数量。使用平均

-mAP

N给

出稍高的值。值得注意的是，将预测的数量限制在前10

个

中

，给出的性能值与考虑所

有预测时的性能值相似

方法

平均mAP（%）

所有前10

平均mAP

（%）

所有前10

三十三

岁

。

三十二

三十三

岁

。

三十三

岁

。

CES

岁

三十二

岁

三十二

步

十六

岁

十六

岁

十七

岁

十七

岁

使用average-mAP，其是利用0之间的tIoU阈值计算的所有mAP值的平

均值

。

5和0

。

95（包括95），步长为0

。

05.

为了在多个算法之间建立对多个类别的真阳性和假阳性之间的比

率变化具有鲁棒性的中间地带，我们采用归一化平均AP [18]。以这

种方式，我们可以比较地面实况实例的不均匀子集之间的平均- mAP，

例如当

对于给定检测率，给定类别的实例的数量是另一类别的实例的数

量的两倍时。我们根据归一化精度

（c）=

（

）

计算归一化

mAP

（

mAP N

）

，其中

是置信水平，R（c）是置信

度

至少为c的

阳性样

本的召回率

，F（c）是置信度至少为c的预测的假阳性率，并且N是

常数。我们报告average-mAP

作为动作定位度量，并将N设置为每个

类的地面实况片段的平均数量。

算法。我们通过研究ActivityNet中最新的动作定位任务[ 13]中的四种

奖励方法来举例说明我们的诊断工具的使用

（表

总结了这些方法的

特点）

。

实际上

，所有方法都以两阶段的方式解决问题，使用建议

方法[2，9，12，6，34]

，

然后是分类方案[38，39，40]。然而，存在

与突出显示相关的细微设计差异。

[26].它是最新动作本地化挑战赛的获胜者，平均差距为2%。其

成功的关键在于改进行动建议阶段。为此，这项工作重新制定了完全

卷积动作检测网络SSAD [25]作为类不可知检测器。检测器生成具有

多个持续时间的段的密集网格，但只有靠近实例发生的那些段才获得

高分。除了

多个

算法

之外，

该算法基于TAG分组方法[ 42]的输出来

实现最后，独立于建议阶段结果在视频级执行

CES

[13，45]。这项工

作在挑战赛中获得了亚军[13]，并在当时的THUMOS14上保持了最先

进的方法它采用时间分组启发式算法，用于从密集的actioness预测中

生成行动建议[42]这些建议在随后的阶段进行分类和细化

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

视频理解：时间动作检测器错误分析与诊断

DETAD:诊断时间动作检测器中的错误（ECCV 2018）

时序数据异常检测

键盘检测器

2汽车检测与诊断-掌握发动机检测的一般知识.pptx

基于PLC的列车司机控制器触点动作状态检测系统设计.pdf

汽车电控系统检测诊断新理念(1).pptx

debug_new:以动态方式记录C++用户函数调用中的每一个new和delete动作，用于内存泄漏检测

剩余电流动作保护器智能巡检系统.rar

三菱QCPU可编程控制器错误诊断与安全注意事项

MATLAB版数值方法：FX3U-CF-ADP应用中的错误检测与处理

最新资源