无监督图像对齐与形状解缠：变形自动编码器的研究

66 浏览量更新于2024-06-20 收藏 1.89MB PDF 举报

变形自动编码器是一种创新的无监督学习模型，专用于图像处理领域的形状和外观解缠。它借鉴了可变形模板的概念，将形状视为规范坐标系（模板）与非可变形模板之间的空间变换。不同于传统的深度生成模型，变形自动编码器关注于分离图像中的变化因素，如形状、纹理和光照等，这有助于增强模型的解释性和可控性。该模型的核心组成部分包括一个编码器，负责捕获输入图像的特征；一个解码器，能够从潜在表示中生成重构图像；以及一个空间扭曲模块，用于在模板坐标系中表示和操作形状变化。模型的设计理念是通过无监督的方式，使得图像能够被自动对齐，这在诸如人脸识别、手部操作和数字图像处理等领域有着广泛的应用。具体来说，变形自动编码器可以实现以下功能： 1. 形状和外观插值：通过学习形状和纹理的独立变化，模型能够生成不同形态之间的连续过渡，比如人脸表情的改变或者手部姿势的调整。 2. 无监督图像对齐：在没有标签的情况下，模型能自动识别并纠正图像间的相对位置，这对于大规模图像数据集的处理非常有用。 3. 地标定位与表情morphing：通过学习形状与局部特征的关联，模型能够进行地标（如眼睛、鼻子等）的无监督定位，并实现表情的自然转换。 4. 更深层次的解缠：模型能够进一步分解人脸图像，将它们分解为阴影、反照率等元素，这样便能实现对图像的精细操控，比如单独改变一个人脸的阴影效果或皮肤亮度。 5. 潜在空间的分离：通过学习潜在空间的不同维度，模型能够独立控制如年龄、性别等属性的变化，这在生成具有特定属性的新图像时显得尤为关键。总结而言，变形自动编码器在图像分析和生成任务中展现出强大的潜力，不仅提升了模型的解释性，还为深度学习模型在图像处理领域的实际应用提供了新思路。其无监督的学习策略和多维度分解的能力，使其成为未来计算机视觉和图像编辑领域的重要研究工具。

Shu

，

Saha

sra

budhe

，

Guül

，

Sama

，

ragio s

，

两个过程的组合：在

无

变形坐标系（

“

模板

”

）上合成外观通过

（

）

表示在坐标

（

，

）处的合成外观（或纹理）的值，并且通过

（

）表示估计的变形场，我们如下重建观察到的图像

（

）

I（p）T（W（p））

，

（

）

即，通过查找位置W（p）处的合成尺寸的外观来获得位置p处的图像外

观这是在双线性采样层

[15]

方面实现的，它允许我们通过扭曲过程传递

梯度外观和变形函数由独立的解码器网络合成。到解码器的输入由联合

编码器网络递送，所述联合编码器网络将观察到的图像作为输入并且递

送形状和外观的低维潜在表示Z这被分成两个部分，Z

= [

，

]

，其分

别馈送到外观和形状网络中，

为我们提供了形状和外观的清晰分离。

2.1

变形场模拟

我们使用一些领域知识来简化和加速学习，而不是将变形建模完全留给

反向传播。第一个观察是，全球方面可以使用低维线性模型表示我们通

过仿射空间

Transformer

层来解释全局变形，该层使用六维输入来合成变

形场作为固定基础上的扩展

[15]

。这意味着上述形状表示Z

被分解成两

个部分Z

、

，其中Z

表示仿射，并且Z

表示变形场的非刚性学习

部分作为可变形建模

，

10]

中的常见实践，这些变形场由单独的解码器

生成并且被组成，使得仿射变换将详细的非刚性扭曲扭曲到它们应该应

用的图像位置。

我们注意到，不是每个非刚性变形场都是合理的。在没有适当的正则化

的情况下，变形场可以相当于通用置换矩阵。如图所示。如图

（

）所

示，非正则化变形可以将连接的纹理图案扩展到断开的图像区域。

为了防止这个问题，代替形状解码器

CNN

直接预测局部扭曲场W

（p）

（W

（x

，

y）

，

（x

，

y）），我们考虑

和

，其中

表示空间梯度的第

个

vector.

这两个量测量连续像素的位移

例如，

= 2

相当于水平缩放

的大

小，而

−

相当于左右翻转

;

类似的行为与

在

垂直轴上。我们注意到全局旋转由仿射翘曲场，

，

与次要

的小局部旋转相关

因此我们关注

，

。有了这两个值，我们就可以

控制变形场，因为我们可以通过控制

，

来

防止折叠

过度拉伸。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

无监督图像对齐与形状解缠：变形自动编码器的研究

二维对称图像自动对齐网络

点云数据与RGB图像对齐

display:flex; 垂直对齐CSS应该怎么写

matlab图像对齐‘

display: flex;flex-direction: column;左对齐

html中的 background-position

halcon两张图像对齐

图像对齐法（Image Alignment）

OpenCV Python图像对齐

点云 与图像对齐 和联合标定什么关系

最新资源

点云与图像对齐和联合标定什么关系