我们的方法所使用的将不包含遮挡物,并且迁移学习变得有用。
在实践中,我们使用[11]中描述的特征映射,其可用于将从真实图
像提取的图像特征映射到合成图像的对应图像特征我们的方法不
需要这一步来超越最先进的技术,但允许我们提供额外的性能提
升。
在本文的其余部分中,我们首先讨论相关工作,然后介绍我们的
方 法 , 最 后 对 其 进 行 评 估 并 将 其 与 Occluded LineMOD [12] 和 YCB-
Video [3]数据集上的最先进方法进行比较。
2
相关工作
关于3D对象姿态估计的文献非常多。在基于边缘[13]和基于关键点的方
法[14]的流行之后,机器学习和深度学习近年来变得流行,以解决这个
问题。 lem [5-7,2-4,8,15].在这里,我们将主要关注基于RGB图像
的最新工作。在评估部分,我们将我们的方法与最近的方法进行比较
[5,7,3,4]。
[4,8]提出了模块的级联,其中第一模块用于本地化目标对象,并
且第二模块用于回归对象表面3D坐标。然后,这些坐标用于通过具
有抢先RANSAC的假设采样来预测对象姿态[9]。最重要的是,我们不
直接预测3D点,而是平均2D热图。如[3]中所讨论的,针对对应的2D
点预测3D点似乎比针对3D点预测2D点要困难得多。此外,曲面坐标
不适用于处理对称对象。在[5]中,目标对象也首先被
确定,预测对
象的3D边界框的c或n
的
2D
边界
,并且最后,使用
P n P
算法从它们的
3D
对应性估计
3D
对象姿态
。[7]将这个想法集成到最近的对象检测器
[16]中,以预测3D边界框的角的2D投影,而不是2D边界框。类似地,
在[6]中,以一组热图的形式预测2D关键点,正如我们在这项工作中
所做的那样然而,它使用整个图像作为输入,因此在遮挡上表现不
佳。它还需要用关键点位置注释的训练图像,而我们使用虚拟3D
点。在[17]中,还依赖于2D关键点检测。作者考虑部分被遮挡的对
象,用于从这些关键点推断3D对象位置。然而,他们的推理采用了
一个复杂的模型拟合,并要求目标对象共现在近规则的配置。
在
[
2]
中,
SS
D
存档
[
18]
被扩展以确定对象的2D位置和3D旋转
。在下一步
骤中,作者使用这些预测
来记录在形式中的计算结果,以确定对象的3D
姿态
。
然而
,这需要精细化步骤以获得准确的姿态,这受到遮挡的影
响。在[3]中对对象进行了分割,并通过预测平移和旋转的四元数(由
ICP细化)来估计其3D姿态。分割对象使他们的方法对遮挡具有鲁棒
性