深度学习驱动的鲁棒基本矩阵估计：适应数据的高效算法

178 浏览量更新于2024-06-20 收藏 789KB PDF 举报

深度学习在计算机视觉领域的广泛应用，尤其是在图像处理任务中，如分类、分割和对象检测，已经证明了其强大的表达能力和自适应学习能力。然而，尽管某些问题如基本矩阵估计能够通过精确的数学模型定义，传统的数学方法在面对噪声数据污染、数据分布变化等问题时可能表现不佳，因为它们往往依赖于固定假设。在这个背景下，"基于深度学习的鲁棒基本矩阵估计方法"研究旨在利用深度学习的优势解决基本矩阵估计中的鲁棒性问题。研究人员Rene Ranftl和Vladlen Koltun来自英特尔实验室，他们提出了一种创新的解决方案，将深度学习与传统的几何模型结合，设计了一个能够从数据中学习并适应噪声分布的估计框架。这种方法避免了直接将深度学习应用于问题的复杂性，而是将估计过程分解为一系列加权齐次最小二乘问题，每个问题由深度网络估计出鲁棒的权重。这个新方法的优点在于其端到端的学习能力，这意味着整个估计流程可以从大量的标注数据中自动学习，无需人为地调整参数来适应不同的场景和噪声类型。与传统的RANSAC等随机抽样和迭代方法相比，这种方法更加高效，且提供了更可解释的估计结果，因为它能够分离局部运动估计和几何模型拟合，使得结果更易于理解。实验结果显示，通过这种方法训练得到的估计器在处理实际数据时，能够显著优于经典的方法，展现出在鲁棒性和性能上的优势。这对于那些依赖于基本矩阵估计的三维视觉应用，如SLAM（同时定位和地图构建）系统，具有重要的实际价值，因为它们能更好地应对各种复杂的环境条件。总结来说，这项工作标志着深度学习技术在计算机视觉传统问题上的潜在突破，它不仅提高了基本矩阵估计的鲁棒性，而且提供了更灵活、更高效的解决方案，有助于推动该领域的实验室研究向实际应用迈进。

R. Ranftl和V.Koltun

我

点可以是某个度量空间中的点，或者在基本矩阵和单应性估计点对应的情况

下（例如，在这种情况下，我们

通过连接

两个图像坐标的

Put iv e

对应

iParticipp

′

），得到

p i

∈

R 4

。

在许多几何模型拟合问题中，提出了一种齐次最小二乘优化方法。

问题出现：

尽量减

少

n（A（P））

服从x

，

（

）

其中

x∈

′

定义模型参数，

：

P →

′

（

≥

′

，

k >

）是数据点的问题特

定映射

注意，（1）允许闭合形式的解。出现这种形式的优化问题的算法的流行示

例是用于基本矩阵估计的八点算法[13]、直接线性变换（DLT）[12]和一般总最

小二乘拟合。

考虑超平面拟合作为一个简单的例子。设（

，

）指定一个法线

为

、

截距为

的超平面

。超平面拟合的目标是从一组点

推断（

，

）。为了在

完全最小二乘意义上拟合超平面，我们有

A（P）

∈

，

（A（P））

−

（二）

用这个定义求解（

）允许我们使用将x映射到模型参数的模型提取函数

（x）来提取平面

（x）=

，

−

⊤

（

，

）

。

（三）

如果数据没有异常值，则最小二乘解将接近真实解（取决于内点噪声分布和

问题的具体形式）。然而，在实际应用中，数据通常包含异常值。(Even更糟糕

的是，可能存在比内点更多的离群点。）在最小二乘意义上解决估计问题将产

生错误的估计，即使在存在单个离群值的情况下。

许多工作已经进入寻找几何模型拟合的鲁棒方法[7，39，30，14]。一种可

能的解决方案是将鲁棒损失函数Φ应用于（1）中的残差。由此产生的优化问题

不承认一般的封闭形式的解决方案。近似求解优化问题的一种实用方法是通过

求解一系列重新加权的最小二乘问题[38]：

= arg min

（p

，

）（A（P））

，

（

）

：

其中权重w的确切形式取决于Φ和手头的几何模型

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习驱动的鲁棒基本矩阵估计：适应数据的高效算法

基础矩阵的鲁棒估计方法

基础矩阵鲁棒算法的研究.

基于深度学习的广义频分复用系统时频双选择信道估计.docx

基于鲁棒可靠性方法的机器人鲁棒镇定控制研究.pdf

基于深度学习的视觉语义地图构建.pdf

Deepsort是一种基于深度学习的多目标跟踪算法.docx

基于迁移学习的小样本垂直阵目标距离估计方法.docx

图像特征匹配中一种高效的鲁棒估计算法.pdf

深度学习驱动的密集场景人流估计：卷积神经网络方法

深度信息驱动的鲁棒人体再识别

最新资源