视觉-惯性融合：目标检测、映射与3D场景理解

79 浏览量更新于2024-06-20 收藏 1.44MB PDF 举报

视觉-惯性目标检测和映射是一种新兴的技术，由费孝瀚和斯特凡诺·索亚托在加州大学洛杉矶分校视觉实验室共同研究。这项工作关注的是如何在仅依赖单目视频和惯性传感器的环境中，实现对3D场景中目标的实时检测、识别和定位。他们的方法突破了传统的RGB-D或立体视觉技术的局限，转向使用视觉和惯性传感器的融合。关键点在于，他们提出的系统由自下而上的深度网络和自上而下的模块组成。深度网络负责检测物体并提供对象存在的可能性得分，而非线性滤波器则作为记忆单元，处理并整合时间序列的数据，以推断物体的因果关系。此外，另一个网络用于提供边缘的似然性得分，增强了系统的鲁棒性和准确性。系统的核心目标是生成一个稀疏点云，展示可见但未被识别为已知对象的场景部分，同时通过物体模型和欧几里得框架下的精确姿态信息，实现对场景的细致映射，即使在当前帧中某些区域无法直接观察到。这种映射允许系统预测物体的位置和动态，即便在不同视角或者遮挡的情况下也能保持一致性。在实验阶段，研究人员在现有的数据集上验证了他们的算法，并且还发布了名为VISMA的数据集，这个数据集包含地面实况姿态、点云地图、对象模型以及同步的惯性测量数据，为后续的研究提供了丰富的基准。这种方法的应用前景广泛，包括自动驾驶、机器人导航以及增强现实等领域，因为惯性传感器的普及使得这种低成本且高效的解决方案变得可行。总结来说，视觉-惯性目标检测和映射是一项结合视觉和惯性信息的先进技术，它在处理3D场景理解任务时展现出强大的潜力，有望在未来智能设备和实时环境感知中发挥重要作用。

X. Fei和S. Soatto

^其中

是gravity的

方向

，并且该操作

构造

了

一个偏斜。

我们将语义映射问题公式化为估计后验

（

{

，

}

，

）

在

模型

上进行约束，可在

假设检验框架中进行构造，其中假设空间

是形状标签和姿态的笛卡尔积

{

}

× {

}

。为了便于计算和避免

计算不

确定性，我们

将

置于一个

辅助离散随机变量的约束条件下：范畴

∈

{

，

···

，

}

。

（

{

，

}

（

）

（

{

，

}

）

（

2）

∝

（

{

，

}

）

∫

（

{

，

}

{

，

}

−

）

（

{

，

}

−

）

（

3）

其中对所有可能的类别执行边缘化注意到类别

是形状标签k t的确定

性函数，即

（

）=

（

−

（

））

，

eri

或

（

{

，

}

可以

如

下实现这些方案：

（

−

（

））

（

{

，

}

）

∫

（

{

，

}

{

，

}

−

）

（

{

，

}

−

）

（

4）

其中，求和中的第一项是可能性（Sect.二、4）和第二项可以近似的

加权粒子的数值积分（3）第三章。

2.3

参数化和动力学

每个对象被局部参数化并且在时间tr处被附接到具有姿态

gic

（

）的参

考相机帧，并且对象姿态的平移部分由相机坐标中的方位向量[

，

]

∈

和对数深度

∈

来参数化，

其中

（

）

∈

。

日志

记录

依赖于

它所保证的积极性和手性。逆深度[6]虽然经常被SLAM社区使

用，但具有奇异性，并且不在我们的系统中使用。然后，对象质心在

参考相机坐标系中为

exp（

）

[

，

并且在惯性坐标系

中为

（

）

。对于方位角

，我们将其参数化为

整数形式，

并获得了

用于

u la的

gue

s'处的位置

：

（

）

（

−

cos

）

从向量得到对称矩阵。因此，惯性系中的物体姿态为

=[R

Tio

]

∈

SE（3）。虽然姿态参数是未知常数而不是时变量，但我们将它们视

为随机过程

，并将三个变量作为

一个共同

的实际

问题

：

[

，

]

[

，

]

其中

，

和

是具有小方差的零均值高斯

噪声。

2.4

测量过程

在

此选择中，我们将我们的应用程序应用于对数线性逻辑

（

{

，

}

）

l og

（

{

，

}

）

。

在

（

{

，

g } t − 1

）上的

{

，

g }

−

1}上，

−

）

，

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

视觉-惯性融合：目标检测、映射与3D场景理解

视觉-惯性单目SLAM系统：地图重用与零漂移定位

视觉-惯性SLAM算法详解：入门与实践

属性文法与orb-slam3：视觉-惯性导航开源库的精度解析

dl-vision-papers：深度学习和三维视觉相关的论文

论文研究-视觉SLAM初始化IMU算法研究 .pdf

机器人无标定视觉伺服控制研究进展

基于视觉的并联机器人守门控制技术研究.pdf

计算机视觉在VR终端仿真中的作用.pptx

CVPR18 AVOD论文详解：3D目标检测与自动驾驶的深度解析

基于ROS2与多传感器的机器人定位与映射系统

最新资源