自动编码变换(AVT)：无监督学习的变换等变表示研究

PDF格式 | 12.05MB | 更新于2025-01-16 | 145 浏览量 | 举报

"这篇文章主要介绍了无监督学习中的自动编码变换（AVT）方法，用于实现变换等变表示。作者提出了一个新策略，即利用自动编码器来最大化变换和表示之间的互信息，从而训练出适用于通用变换的Transformation-Equivariant Representations (TERs)。这种方法在没有标注数据的情况下，能捕获图像在各种变换下的视觉结构，且在无监督任务中表现优秀，显著缩小了与有监督模型的性能差距。" 在计算机视觉领域，无监督学习是一个重要的研究方向，特别是在数据标注成本高昂的情况下。自动编码变换（Autoencoder Transformations, AVT）是针对这一挑战提出的一种新方法，其核心在于学习一种对变换等变的表示。传统的自动编码器主要用于数据压缩和重构，而AVT则更进一步，不仅要求重构原始数据，还要求在不同变换下保持表示的一致性。论文中提到的Transformation-Equivariant Representations (TERs) 是由Hinton等人引入的概念，这些表示能够捕捉到图像在多种变换下的不变性，比如旋转、缩放和平移。通常，卷积神经网络（CNNs）的平移等变性被认为是其在监督学习任务中成功的关键因素。然而，CNNs对其他更复杂的变换可能不那么敏感，而这正是AVT试图解决的问题。 AVT通过最大化变换后的图像与其表示之间的互信息来进行训练。互信息是一种衡量两个随机变量之间依赖程度的度量，最大化互信息可以使得表示包含更多的关于输入图像的信息，特别是在经过各种变换后。在技术实现上，AVT采用变分方法，引入了一个变换解码器来近似不可计算的变换后验，构建了一个包含表示编码器和变换解码器的自动编码架构。实验结果显示，AVT模型在无监督任务上表现出色，甚至在某些情况下超越了传统的有监督学习模型。这表明，通过无监督学习，我们能够在没有标签的情况下学到具有强大泛化能力的特征，这对于大规模数据集的应用尤其有价值。自动编码变换（AVT）提供了一种有效的无监督学习框架，用于学习变换等变的表示，这对于提升模型在真实世界场景中的鲁棒性具有重要意义。这一方法为未来在图像识别、物体检测等领域进一步研究无监督学习和等变表示打下了坚实的基础。

8130

AVT：通过自动编码变换实现无监督学习的变换等变表示

齐国俊1,2，*，张立恒1，陈昌文3，田琦4

1机器感知与学习实验室（MAPLE）

http://maple-lab.net/

2华为云，4华为诺亚方舟实验室，3香港中文大学深圳研究院和彭城实验室

guojun.qi@huawei.com

http://maple-lab.net/projects/AVT.htm

摘要

Transformation-EquivariantRepresentations

(TERs)的学习是由Hinton等人[16]引入的，被认为是揭示各

种变换下的视觉结构的原则。它包含了著名的卷积神经网络

（CNNs）作为一个特殊情况，只与平移等变换等价。相反

，我们寻求以无监督的方式训练适用于一类通用变换的TERs

。为此，我们提出了一种新的原则性方法，即自动编码变换

（AVT），与传统的自动编码数据方法相比。形式上，给定

变换后的图像，AVT通过最大化变换和表示之间的互信息来

训练网络。这确保了个体图像的结果TERs包含了其视觉结构

的内在信息，这些信息在广义非线性情况下会在各种变换下

等变地显现出来。从技术上讲，我们证明了通过最大化互信

息的变分下界可以有效地解决所得到的优化问题。这种变分

方法引入了一个变换解码器来近似变换的不可计算后验，从

而得到一个具有表示编码器和变换解码器的自动编码架构。

实验证明，所提出的AVT模型在无监督任务上取得了新的记

录，大大缩小了与监督模型之间的性能差距。

*通讯作者：齐国俊。电子邮件：guojunq@gmail.com。这个想法是由齐国

俊构思和制定的，而张立恒在华为云实习期间进行了实验。

1.引言

当大量标记数据可用于训练模型时，卷积神经网络（CNNs

）在取得巨大成功时表现出色。尽管缺乏坚实的理论，但人

们认为图像平移的等价性和不变性在CNNs的成功中起着关

键作用[6,7,34,16]，特别是对于监督任务。具体而言，虽然

整个网络是以端到端的方式进行训练的，但典型的CNN模型

由两部分组成：输入图像通过多个卷积层的卷积特征图和将

特征图映射到目标标签的全连接层的分类器。显然，监督分

类任务要求全连接分类器对变换不变的标签进行预测。为了

训练CNN模型，这种变换不变性准则是通过最小化标记示例

上的分类错误来实现的，这些示例通过各种变换进行了增强[

22]。不幸的是，如果没有标签监督，简单地应用变换不变

性来学习无监督表示将导致任何输入图像的平凡常数表示。

相反，不难看出通过卷积层生成的表示对变换是等变的-

平移图像的特征图也以相同的方式进行了移动，受到边缘填

充效应的影响[22]。自然而然地，我们可以通过考虑超出平

移的更多类型的变换（例如，图像扭曲和投影变换）来推广

这个想法[6]。在本文中，我们将变换等变性的概念形式化为

训练无监督表示的准则。我们希望它能够学习表示-

下载后可阅读完整内容，剩余9页未读，立即下载

cpongm

粉丝: 6

自动编码变换(AVT)：无监督学习的变换等变表示研究

GraphTER: 无监督学习的图变换等变表示

深度学习入门：深度自动编码器实现高效无监督降维

无监督学习新突破：AET自动编码转换技术对比AED

YUV空间中基于稀疏自动编码器的无监督特征学习_李祖贺.pdf

无监督学习包括聚类分析，主分量分析，稀疏编码与学习

利用卷积自动编码器实现均值漂移聚类无监督图像分割

无监督图像对齐与形状解缠：变形自动编码器的研究

图像自动编码器深度学习应用与实现

MATLAB深度学习框架构建及自动编码器实现

深度学习辅助的电缆早期故障识别：S变换与堆叠自动编码器结合方法

最新资源