实时RGB管道检测与6D姿态估计：基于隐式3D方向学习

196 浏览量更新于2024-06-19 收藏 1.62MB PDF 举报

"基于隐式3D方向学习的RGB图像中的实时管道对象检测和6D姿态估计" 本文介绍了一种创新的实时RGB图像中的管道对象检测和6D姿态估计方法。这种方法利用了去噪自动编码器的一个变体，即增强自动编码器，来实现3D方向的估计。与传统的姿态估计技术相比，该方法具有几个显著优势： 1. **无需真实姿态注释**：该算法能够自我学习，不需要用真实姿态注释的训练数据，这大大降低了数据收集和标注的成本。 2. **传感器泛化能力**：它可以适应各种不同的测试传感器，增强了系统的适用性。 3. **处理对称性**：面对对象和视图的对称性问题，该方法能有效处理，避免了由于对称性导致的定位不准确。 4. **领域随机化**：通过在3D模型的模拟视图上使用领域随机化，算法能够在多种环境中进行训练，提高了鲁棒性。在T-LESS和LineMOD数据集上的实验结果证明，这种方法在基于模型的方法中表现出色，甚至可以与那些需要真实姿态注释图像的最先进的方法相媲美。这些数据集通常用于评估6D目标检测和姿态估计的性能。 **1. 6D目标检测与姿态估计**：6D目标检测是指确定目标物体在3D空间中的位置和旋转，这对于机器人操作和增强现实等应用至关重要。姿态估计则涉及计算物体相对于摄像机的旋转和平移参数。 **2. 域随机化**：这是一种训练策略，通过在虚拟环境中随机改变光照、纹理和背景等因素，使得模型能够学习到更广泛的场景表示，从而提高实际环境中的表现。 **3. 自动编码器**：自动编码器是一种无监督学习的神经网络，用于学习输入数据的紧凑表示，这里被用来去噪并估计3D方向。 **4. 合成数据**：由于真实世界数据的获取成本高，使用合成数据训练模型可以降低成本，同时提供大量多样化的情况。 **5. 姿态模糊性**和**对称性**：这两个概念是姿态估计中的挑战。姿态模糊性指的是由于观测角度的不确定性导致的多个可能姿态。对称性则使得物体的不同部分在视觉上难以区分，增加了定位的难度。该研究提出的新方法旨在克服现有的6D对象检测模块的局限性，包括对遮挡、背景噪声和动态环境变化的敏感性，以及对纹理和形状的要求。通过使用增强自动编码器和领域随机化，该方法提高了鲁棒性、泛化能力和处理对称性问题的能力，同时减少了对注释数据的依赖，为实时管道对象检测和6D姿态估计提供了一个高效且实用的解决方案。

M. Sundermeyer，Z.Marton，M.Durner，M.布鲁克河Triebel

COCO背景图像[21]，同时改变亮度和对比度。这使得网络可以泛化

到真实图像，并在10Hz下实现6D检测像我们一样，为了获得非常准

确的距离估计，他们依赖于使用深度数据的迭代最近点（ICP）后处

理。相反，我们不把3D方向估计作为一个分类任务。

2.2

学习3D方向

我们描述了固定SO（3）参数化训练的困难，这将激励学习对象特定

的表示。

回归分析由于旋转存在于连续空间中，因此直接回归固定的SO（3）

参数化（如四元数）似乎很自然。然而，代表性约束和姿势模糊可能

会引入收敛问题[32]。在实践中，用于全3D对象取向估计的直接回归

方法并不十分成功[23]。

3D对象取向的分类需要SO（3）的离散化。即使是相当粗略的

150

度的

间隔也会导致超过50，000个可能的类。由于每个类只在训练数据中

稀疏出现，这阻碍了收敛。在SSD6D [17]中，通过分别对离散化视点

和平面内旋转进行分类来学习 3D 方向，从而将复杂度降低到

（

）。然而，对于非规范视图，例如，如果从上面看到一个对象，

视点的改变几乎等同于产生模糊类别组合的平面内旋转的改变。通

常，在执行单热分类时，忽略不同取向之间的关系。

当依赖于3D方向的固定表示时，对称性是一个严重的问题，因为它

们会导致姿势模糊（图2）。如果不手动处理，相同的训练图像可能

具有不同的方向标签，这可能会严重干扰学习过程。为了处理模糊的

对象，文献中的大多数方法都是手动调整的[40，9，17，28]。这些策

略从忽略一个旋转轴[40，9]到根据对象[17]调整离散化到训练额外的

CNN来预测对称性[28]。这些描述了预先过滤掉对象对称性（2a）的

繁琐的手动方式，但是处理由于自遮挡（2b）和遮挡（2c）引起的歧

义更难解决。对称性不仅影响回归和分类方法，而且影响任何仅通过

固定SO（3）表示来区分对象视图的基于学习的算法。

描述符学习可以用来学习与对象相关的表示，在低维空间中投影视

图。Wohlhart等人。[40]介绍了一种基于CNN的描述符学习方法，该方

法使用三元组损失，最小化/最大化相似/不相似对象方向之间的欧几

里得距离。虽然

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

实时RGB管道检测与6D姿态估计：基于隐式3D方向学习

用于3D对象检测和姿态估计的方法

基于隐式低秩表示的联合投影学习算法及图像识别

图像处理源码-nglod-神经几何细节水平：隐式3D曲面的实时渲染

推荐系统中基于隐式反馈的先发攻击检测方法-研究论文

论文研究-基于隐式评分和相似度传递的学习资源推荐.pdf

实时RGB图像的6D物体检测与姿态识别：ECCV2018最佳论文

基于Python和神经网络的图像隐式水印检测技术

RGB图像中基于模型的3D物体非线优化跟踪方法详解

基于隐式多项式的3D表面重建技术

基于Kalman滤波的3D姿态估计在机器人控制中的应用

最新资源