深度学习光流估计的不确定性与决策信息分析

147 浏览量更新于2024-06-20 收藏 1.11MB PDF 举报

"这篇论文探讨了在光流估计中如何进行不确定性估计，以及这一估计对于计算机视觉任务的重要性。作者提出了一种新的网络架构和损失函数，使得在无需采样或合奏的情况下，能够通过单次前向传递有效地进行不确定性估计。通过对大规模计算机视觉任务的实验，他们展示了所提出的不确定性估计方法的优越性能，这对于诸如自动驾驶等应用中的决策制定至关重要。" 光流估计是计算机视觉领域中的一个重要问题，涉及到图像序列中像素级别的运动估计。近年来，深度学习，尤其是卷积神经网络(CNNs)在光流估计任务中取得了显著的进步，如FlowNet系列模型，它们能够在保持高精度的同时实现交互式的运行速度。然而，这些深度学习模型的“黑盒”特性意味着它们的决策过程难以理解和解释，这在安全关键的应用中是一个重大问题。不确定性估计是解决这一问题的一种途径，因为它可以提供关于模型预测的可信度信息。在光流估计中，不确定性估计可以帮助识别那些可能有误的预测，比如在图像中的阴影区域或复杂运动边界，这些地方的光流估计通常更具挑战性。论文中提到，传统的光流估计方法往往无法提供这种不确定性信息，而新的网络架构和损失函数设计则旨在同时估计光流和其不确定性。作者对比了多种不确定性估计策略，并在大规模的计算机视觉任务，如KITTI数据集上的光流估计中进行了评估。结果显示，新方法能够生成高质量的不确定性估计，这比以往的置信度度量更优，并且可以实时反馈，有助于在实际应用中做出更加明智的决策。此外，论文还讨论了多网络假设的潜在问题，即不同的网络可能会对同一场景有不同的估计，这进一步强调了不确定性估计的必要性。通过联合估计光流和不确定性，模型可以识别并标记出那些可能的不一致区域，提高系统的鲁棒性和安全性。这篇研究为理解和改进深度学习模型在光流估计中的可靠性提供了新视角，推动了计算机视觉领域的进步，尤其是在需要高度准确性和可靠性的应用场景，如自动驾驶汽车的视觉感知。

，

进来

吧

，

。

Mak

，

and

认知不确定性（解释模型不确定性）在联合框架中进行了研究。我们

表明，在本文中，辍学策略中使用所有先前的计算机视觉应用[15，

26]本身并不是最好的，并且其他策略产生更好的结果。

与诸如MCMC采样的贝叶斯方法相比，自举是一种易于实现并且

很好地扩展到高维空间的频率论方法，因为它仅需要权重的点估计。

其思想是在训练数据的

个

不同的自举子集上独立地训练

个

神经网

络，并将它们视为来自权重分布的独立样本。虽然自举不能确保模型

的多样性，在最坏的情况下可能会导致

个相同的模型，

Lakshminarayanan等人。[19]认为，集成模型平均可以被视为丢弃平

均。他们用随机初始化和随机数据洗牌训练单个网络，其中每个网络

预测均值和方差。在测试期间，他们结合了各个模型的预测，以解释

网络的认知不确定性。在我们的实验中，我们还考虑了所谓的

快照集

合

[11这些是通过随机梯度下降与热重启（SGDR）[21]相当有效地获

得的

多假设估计针对所提出的多假设网络的损失函数与Guzman-Rivera

等人有关[9]，他为SSVM提出了Lee等人。[20]将损失应用于网络集

合，Chen Koltun [4]应用于单个CNN。

深度网络的不确定性估计

假设我们有一个数据集

{

（x

，

ygt

）

，

. . .

，

（x

，

）

}

，其由以下等式

生成：

从联合分布

（x

，

y）中采样在CNN中，假设存在

通过函数

（x）从x到y的唯一映射，其由根据D上的给定损失函数

优化的权重w参数化。

对于光流，我们将训练的网络表示为从输入图像x =（I

，

）

到输出光流y =（u

，

v）的映射，如y =

（I

，

），其中u

，

v是

光流的x和y分量Dosovitskiyet al.[6]最小化每像素端点误差

√

EPE

（

−

）

（

−

）

，

（1）

其中为了简洁省略了像素坐标如

图

中所描绘

的

，该网络完全基于

两个网络

k的概率输出

根据损失函数，这通常对应于分布p（y）的平

均值|X

，

D）。在本文中，我们研究了三种主要的方法来估计方差

。这些都是基于经验方差的分布的合奏，分布的参数模型，和

两者的组合所有这些方法中的方差用作不确定性的估计

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习光流估计的不确定性与决策信息分析

不确定性预测

模糊运动图像运动长度运动角度估计 模糊运动图像运动长度

2D-target-tracking-master_kalmantracking_kalmanfilter+2D_目标跟踪_信息

光流法：三维运动估计的关键策略

复杂环境下移动机器人光流避障算法

Wolf方法在光流聚类中的应用及MATLAB实现

视觉与红外结合的移动机器人避障策略：光流法与红外测距的应用

鲁棒估计算法提升低层视觉处理的准确性

光流法在运动目标检测中的应用

MATLAB图像特征提取中的光流法与运动分析：深入理解与应用

最新资源

模糊运动图像运动长度运动角度估计模糊运动图像运动长度