Occlusion-Net：图网络驱动的2D/3D遮挡关键点定位

PDF格式 | 2.09MB | 更新于2025-01-16 | 85 浏览量 | 举报

"Occlusion-Net是一种使用图网络来定位2D/3D被遮挡关键点的框架，尤其适用于单个视图中的关键点定位。该框架基于自我监督学习，利用现有的检测器（如MaskRCNN）作为输入，这些检测器仅在可见关键点上进行训练。Occlusion-Net的核心是图形编码器网络，它能够分类不可见的边缘，而图形解码器网络则负责校正被遮挡关键点的位置。三焦点张量损失函数为不可见关键点提供了间接的自我监督，而2D关键点通过3D图形网络进行处理，利用自监督重投影损失来估计3D形状和相机姿态。在测试阶段，Occlusion-Net能够在多种遮挡条件下准确定位单个视图中的关键点。该方法已经在合成的CAD数据和大型真实世界图像集（如CarFusion数据集）上进行了验证，并且与人类标注的不可见关键点准确性进行了比较。处理遮挡是计算机视觉领域的一个长期挑战，因为遮挡类型、数量和程度的多样性会导致方法失效。Occlusion-Net的贡献在于提供了一种新的、有效的处理遮挡问题的途径。" 在这个摘要中，主要知识点包括： 1. **Occlusion-Net框架**：这是一个用于处理被遮挡关键点定位的框架，它结合了图网络和自我监督学习。 2. **图网络**：图形编码器和解码器网络用于处理不可见边缘，修正关键点位置，这在处理遮挡问题时尤其重要。 3. **三焦点张量损失**：这是一种损失函数，为不可见关键点的位置提供间接的自我监督信号，帮助模型学习遮挡情况下的关键点定位。 4. **自监督重投影损失**：在3D图形网络中，利用此损失函数估计3D形状和相机姿态，增强了对遮挡关键点的定位能力。 5. **关键点定位**：Occlusion-Net能在单个视图中准确定位2D/3D关键点，即使在严重的遮挡情况下。 6. **数据集应用**：方法在合成CAD数据和大型真实世界图像集（如CarFusion）上进行了验证，显示了良好的泛化能力。 7. **处理遮挡的挑战**：遮挡是计算机视觉任务中常见的难题，如物体检测、跟踪、重建和识别等。 8. **性能评估**：通过比较人类标注的不可见关键点准确性，评估了Occlusion-Net的性能。 Occlusion-Net提供了一种创新的解决方案，能够有效应对遮挡问题，对于提升计算机视觉系统在复杂环境下的性能具有重要意义。

7328

（

，

）

e i

当无法进行精确的人类标记时，管理CNN训练数据。

然而，他们的方法是分阶段训练的，没有明确地对可

见点和被遮挡点之间的交互进行建模。与我们的工作

最相关的是，[25]在训练期间只包含来自CAD模型的

中间关键点监督有趣的是，他们表明，在合成图像上

训练这样的模型可以推广到真实图像。我们在真实图

像上训练我们的模型，并结合多视图约束来从多个视

图传播地面真实可见的关键点来监督被遮挡的点。

图形神经网络：将关键点建模为图形问题可以追溯到

场景理解的第一次尝试[11，30]。多个作品都建立在

这个图形表示和解决姿态使用信念传播，

[10，36]。最近，[8，21，1，17，7]将经典图形建模

扩展到深度学习范式，并显示出更好的非结构化数据

建模能力

2D-KGNN编码器：2D关键点图网络（

2D-KGNN

）

需要从关键点热图推断被遮挡关键点（或边缘

Eij

）的

位置。我们将热图转换成图表

通过将每个关键点的位置和置信度编码到节点特征

中。关键点

的特征可以更正式地表示为

{

，

}，其中（

，

）是位置，

是置信度，

被定义

为关键点的类型因为我们不知道

图，我们使用GNN来预测潜在图结构。

编码器被建模

为

（

E i

，

其中

fenc（V）是作用于从热图产生的全连

接图的GNN。给定输入图

我们的编码器计算以下消息传递操作以产生遮挡统

计：

enc

（

）

（

）

基于这些方法在图类上的成功

→

e：h

（

[

，

]

）

（2）

（i

，

j）e i j

由于这些任务，最近的多项工作已经扩展了方法来解

决多个3D问题，如形状分割[48]，3D对应[28]和表面

上的CNN。

e→v：h

（ h

）

（3

）

[29]第二十九话我们将关键点预测建模为使用多视图

监督学习的可变形图。

（

，

）

（

[

，

]

）

（

）

闭塞网

Occlusion-Net 由三个主要阶段组成-可见关键点检

测，被遮挡的2D关键点定位和3D关键点定位网络-如

图2所示。2D-Keypoint图形神经网络使图形节点变形

3D-Keypoint图神经网络定位

在上面的等式中，

表示

第

个隐藏层

其中v和e表示网络的顶点和边。这里，v→e表示从顶

点到边的卷积运算，而e

→

v表示从边到顶点的运算。

函数

（）被实现

作为完全连接的层。该编码器的边缘损失是预测边缘

和地面实况边缘之间的交叉熵损失，给出为：

使用自我监督训练的图形的3D关键点-

ing程序。我们结合这些网络来准确预测3D和2D关键

点位置。这一切成功都

Edge

−

，

j∈k

（

）

（

）

以下各节将介绍各个阶段。

是计算的每条边的可见性统计信息

3.1.

二维关键点图神经网络

二维关键点图神经网络（2D-KGNN）由三个组件组

成：初始关键点热图预测、对图形的遮挡统计进行建模

的图形编码器、以及推断被遮挡关键点的2D位置的图

形解码器。我们使用基于热图的方法[16][33]来计算图

像中所有关键点的位置。图形网络的输入由k

个

关键点

组成，其被进一步分类为v

个

可见关键点和o

个

不可见/

被遮挡关键点。我们表示

图的顶点为V=（

，

...

，

对于k

个

关键点，所有节点

之间的关系都编码在边中

从标记的关键点。

2D-KGNN

解码器：被遮挡点预测器解码器从错误的初

始图和从编码器预测的边缘预测被遮挡关键点的一致

的2D关键点位置。这可以在数学上表示为估计P

（

，

），其中

表示-

发送来自解码器的输出图，

是输入

而V是来自初始热图的图形以下消息传递步骤是在

图形网络：

={V

，

}，其

中

，

如果i∈v

且

∈v

→

：

（

，

）

，

（

[

，

]

）

（

）

，

否则

→

：

（

（i

，

j）

）

（7

）

→

e：h

剩余10页未读，继续阅读

cpongm

粉丝: 6

Occlusion-Net：图网络驱动的2D/3D遮挡关键点定位

OCCLUSION-AWARE GAN FOR FACE DE-OCCLUSION IN THE WILD.pdf

matlab女孩代码-Occlusion-Tracking:遮挡感知的实时对象跟踪，IEEETMM2017

gl_ssao：优化的屏幕空间环境光遮挡，可识别缓存的hbao

基于Java3D的网络三维技术的设计与实现

3D全息显示器遮挡消除：反正交投影与低角度采样技术

LASOR：通过合成遮挡数据与神经网格渲染提升人体姿态和形状精准度

探索D3Ddemo19: 浅墨的3D渲染新实验

CodeWarrior图形渲染技术：2D和3D图形高效绘制技巧

【Xtensa图形处理秘诀】：2D_3D图形加速与渲染技术

PFC 5.0深入解析：揭秘顶尖2D图形渲染技术

最新资源