SharinGAN：融合合成与真实数据的无监督几何估计新策略

40 浏览量更新于2024-06-20 收藏 1.54MB PDF 举报

标题：“合成和真实数据进行无监督几何估计的新方法”探讨的是一个关键问题，即如何在没有大量标注的情况下，训练深度学习模型，使其能够适应合成数据和真实世界的场景，特别是在人脸表面法线估计和单目深度估计这两个重要的计算机视觉任务上。传统的挑战在于，尽管合成数据易于获取且带有预设标签，但这些模型在实际应用中往往表现不佳，因为它们无法有效处理合成与真实世界间的域差距。研究者提出了一种名为SharinGAN的新方法，该方法的核心思想是将合成图像和真实图像映射到一个共享的表示空间，这个空间包含两个域都共有的任务相关信息。他们假设图像可以分解为三个组成部分：跨合成与真实共享的通用信息（I）、合成或真实特有的领域无关信息（δ′），以及与任务紧密相关的领域特定信息（δs和δr）。真实图像和合成图像分别表达为xr = f(I, δr, δ′)和xs = f(I, δs, δ′)。为了弥合这种域差距，他们的方法将合成图像中的与任务相关的信息δs和真实图像中的δr映射到一个共享的表示δsh，这样可以保持其他不变的特征，并让回归器专注于学习那些跨越两个域的任务相关特征。这种方法旨在通过端到端的网络训练，使模型能够在无监督条件下显著提高对真实数据的处理能力。研究者通过实验验证了这种方法的有效性，表明它在人脸表面法线估计和单目深度估计等任务上带来了显著的性能提升，证明了将合成和真实数据结合进行无监督几何估计的潜在价值。这种方法不仅有助于克服合成数据的局限性，还可能为未来的计算机视觉任务提供更鲁棒的解决方案。

13976

共享的SemAntic Image

G：发生器

合成

图像

合成

转换

的图

像

合成

预测

主网络

不

D：图像

鉴别器

真实图像

房

转换

的图

像

房

预测

重构损失

虚拟

监管

合成地面真

相

SharinGAN模块

图2：模型架构概述。红色虚线箭头表示损失计算。

Ground Truth形状，以帮助训练网络，从而使用真实图

像预测脸部形状。大多数这些作品最初都是用合成数

据对网络进行预训练，然后进行微调

为了实现这一点，使用对抗损失来找到共享信息

。这是通过最小

化

和

分布的差异来实现的。但

俄

西

它与真实和合成数据的混合，或者不使用超声波，

透视或弱监督，忽视了真实和合成人脸图像之间的域

在这项工作中，我们表明，通过使用我们提出的方法

减少真实数据和合成数据之间的域间隙，可以更好地

估计人脸几何形状。

使用

GAN

的域自适应有许多作品[47，5，25，43，

40]使用GAN框架通过经由监督翻译将一个域映射到另

一个域来执行域自适应。然而，大多数这些只是玩具

数据集上的分类设置。我们试图将合成域和真实域映

射到一个新的共享域中，该共享域在训练过程中学

习，并使用它来解决无监督几何估计的复杂问题。此

外，我们在回归任务中应用了图像级别的对抗性损

失，与上述一些先前的工作相比，域不变特征工程足

以完成分类任务。

方法

为了弥补真实数据注释的缺乏，并在容易获得的合

成数据上训练主要任务网络，我们提出SharinGAN来

减少合成和真实之间的域差距。我们的目标是培养一

个初级

SharinGAN创建的共享域上的任务网络，它学习映射

函数

：

→x

和

：

›→

，其中

（

，

′

）

;

与此同时，为了保护域不可知论信息，

在共享语义信息I（shared semantic informationI）中，

我们使用重建损失。现在，在主任务网络没有损失的

情况下，G可能会改变图像，使它们与标签不匹配。

为了防止这种情况，我们还为真实和合成示例使用了

主要任务损失来指导生成器。重要的是要注意，从合

成到真实的平移，反之亦然，对于这种对称设置找到

共享空间同样重要。为了促进这一点，我们使用了一

种弱监督形式，我们称之为虚拟监督。一些可能的虚

拟监督包括输入数据的先验或约束，可以缩小主任务

网络的解决方案空间（详细信息在3.2.2中讨论）。对

于合成的例子，我们使用已知的标签。

对抗、重建和主任务损失一起训练生成器和主任务

网络，以将两个域中的域特定信息

{δ

，

}

对齐到共享

空间δ

中

，保留其他所有内容。

3.1.

框架

在这项工作中，我们提出训练一个生成网络，称为

SharinGAN，以减少真实数据和合成数据之间的域间

隙，从而帮助训练初级网络。图2显示了我们提出的方

法的框架。它包含生成网络

、体现SharinGAN模块的

图像级

上的判别器和执行主要任务的任务网络

k k

（

，

δ sh

，

δ k

）

; k

∈

，

如图

所示。

允许

主要任务网络在共享空间上进行训练，

生成网络G取合成图像x

或实际图像

作为输入，并将其转换为

或

S R

完成主要任务所需的信息，

网络更适用于测试过程中的真实数据。

为了骗过D。不同于现有的作品，

将一个域中的图像转移到另一个域[3，53，52]，我们的

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

SharinGAN：融合合成与真实数据的无监督几何估计新策略

基于密集特征融合的无监督单目深度估计.docx

结合注意力与无监督深度学习的单目深度估计.pdf

具有数据导引约束的非负矩阵分解用于高光谱分解

YOLO权重数据集合成：弥补数据不足的创新解决方案，助力模型突破

【ArcGIS数据融合】：影像合成中整合不同来源数据的高级技巧

合成孔径雷达技术精讲：成像原理与处理方法全攻略

无监督学习案例研究：大数据集中的异常检测技巧

OpenCV图像旋转与图像生成模型的结合：探索生成式图像的新境界，解锁图像合成新可能

雷达信号合成：掌握理论与实践，提升系统性能

点云数据处理新手指南：从基础到精通的进阶之路

最新资源