刚性学习算法在三维运动场估计中的应用

194 浏览量更新于2024-06-20 收藏 2.37MB PDF 举报

"运动摄像机中的刚性学习算法及三维运动场估计，是关于计算机视觉领域的一个研究，主要关注在动态场景中通过运动摄像机来理解和解析三维运动。该研究提出了一个新的方法，利用监督学习的方式来处理刚性场景，从而更好地估计相机运动和场景流。论文的作者团队来自佐治亚理工学院和NVIDIA公司，他们创建了一个半合成动态场景数据集，包含真实的背景和合成的前景对象，用于训练和评估模型。刚性学习算法的核心在于解决相机运动和场景运动的消歧问题，尤其是在观察到的刚性元素减少的情况下。传统的3D场景流估计方法在处理动态和复杂的视角变化时可能遇到困难，而该论文提出的方法通过学习网络，结合2D光流和推断的刚性掩模，能更准确地估计相机的运动轨迹和场景中物体的3D运动。新数据集的创建是为了支持这一方法的训练和评估，数据集包括了真实背景下的合成对象，允许模型学习区分刚性和非刚性像素，这对于正确估计运动场至关重要。此外，论文还引入了一种评估分割，衡量非刚性像素的比例，以验证方法的有效性。在实验部分，作者展示了他们的框架在处理具有挑战性的动态场景时，相对于现有的3D场景流估计方法有显著的改进。这种技术的进步对于机器人操作、动态场景重建、自动驾驶等多个应用领域都具有重要的意义，能够提高运动估计的精度和鲁棒性。这篇论文提出了一个创新的刚性学习算法，通过深度学习技术在动态场景中进行3D运动场估计，有效解决了运动消歧问题，提升了计算机视觉系统在复杂环境下的性能。"

Z. Lv

等人

ðu

保加

利亚

#→1

ðu

#→1

（

）

第

（

）

款

#→1

场景流

（

）

#→1

投影场景流

编号

德

杜

夫

#→1

光流

保

ðx

#→1

来自摄像机运动的光流

ðu

（

#→1

编

→

0→1

[45]假设刚性可以通过从单个图像微调语义分割网络来学习Yin和Shi

[47]无监督学习3D城市场景中我们感兴趣的是更一般的动态场景与不

受约束的场景运动从移动的摄像机观察，我们地址- dress这通过直接

学习每像素的刚性在监督的方式，可以概括为看不见的场景。

刚性、场景流与运动摄像机

我们专注于解决从移动相机观察到的物理场景中的3D运动场，通常称为

场景流[16，37]。在这里，我们定义的2D图像的对应关系和场景流在物

理3D场景中的对象运动和相机运动从两个时间视图之间的相对相机姿

势。

设x

∈

是运动物体的非刚性表面

Ω

上的点x在时间

相对于固定世

界坐标系的位置。本文定义

→

为

x 从

到

的三维运动矢量，也可

表示

为场景流。当x

由具有已知本征函数的相机观察时，我们定义

（x

）为x

到图像坐标

的投影，并且

−

（

，

）为给定相机参考系

中的已知深度

→1

图3：两帧场景流的几何结构，其中相机从

移动到

，

点

移动

到

（绿色圆圈），以及它们在

这两个图像分别被示为

、

（红色圆圈）。请注意，u

是一

在

中的投影位置，就好像

被

观察到一样，并且可以计算

通过相机运动作为

，

并且

中的

可视化其具有

在I

中。如果相机是静态的，并且在位置处观察到

和

，

opt

flow

woul

dbe

asamto

proojec

eflow

这

是

我

的

图像示出了在相机摇摄下动态场景

的

中的每个流

的

0→1

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

刚性学习算法在三维运动场估计中的应用

运动估计几种算法实现

运动检测算法学习

三维运动估计

通过稀疏表示运动产生的非刚性结构

一种非刚性结构从运动分解的简单先验方法

基于光流反馈的单目视觉三维重建

光流反馈驱动的单目视觉三维重建技术

深度相机驱动的人机交互：现状与挑战

单人姿态估计算法详解

【OpenCV光流法】：运动估计的秘密武器

最新资源