无监督图像分类与分割：基于不变信息聚类的神经网络方法

PDF格式 | 1.49MB | 更新于2025-01-16 | 147 浏览量 | 举报

"基于不变信息聚类的无监督图像分类与分割技术" 本文主要探讨了一种新的无监督图像分类和分割方法，称为“基于不变信息聚类”(Invariant Information Clustering, IIC)。该方法由牛津大学的研究团队提出，旨在解决深度学习中对大量手动标注数据的依赖问题，特别是在大规模图像分类和分割任务中。传统的监督学习方法需要大量标注数据，而无监督学习则尝试在无标签数据上进行学习，降低对人工标注的依赖。 IIC的核心思想是通过神经网络学习能够保持实例间互信息最大化的表示，从而发现具有语义意义的聚类。这一目标确保了网络能够在不同的无监督聚类基准上，如STL10和CIFAR10，生成准确的类别划分，同时直接输出语义标签，无需额外的后处理步骤。在STL10和CIFAR10上，IIC分别取得了6.6和9.5个百分点的准确率提升，显示出其在无监督图像分类任务上的优越性能。不仅如此，IIC的方法也适用于图像分割任务，能有效地对像素级别的类别进行划分。在实验中，使用随机变换从每个图像中获取一对样本，增强了模型的泛化能力。此外，IIC不仅限于完全无监督学习，研究者还探索了两个半监督设置，其中一个在STL10分类任务上达到了88.8%的准确率，打破了现有方法的最高记录，无论是在监督、半监督还是无监督场景下。 IIC的目标函数基于信息论，确保了模型避免常见的退化解决方案，这些解决方案可能在传统聚类与深度学习结合时出现。由于其严格的信息理论基础，IIC易于实现，且能够稳健地处理各种数据集。该研究在GitHub上有公开的代码库，方便进一步的研究和应用。基于不变信息聚类的无监督图像分类与分割技术为深度学习提供了一个有效且高效的解决方案，特别是在处理大规模、高成本标注数据的问题上。通过最大化实例间的互信息，这种方法能够在不依赖标签的情况下，学习到具有语义意义的类别表示，为计算机视觉领域带来了重要的进步。

基于不变信息聚类的

无监督图像分类与分

割

牛津大学

xuji@robots.ox.ac.uk

João F.

牛津大学

joao@robots.ox.ac.uk

牛津大学

University

vedaldi@robots.ox.ac.uk

摘要

我们提出了一个新的聚类目标，从头开始学习神经

网络分类器，只给未标记的数据样本。该模型发现了

准确匹配语义类的聚类，在

个无监督聚类基准中实现

了最先进的结果，跨越了图像分类和分割。其中包括

STL10

（

ImageNet

的无监督变体）和

CIFAR10

，我们分

别以

6.6

和

9.5

个绝对百分点的准确率该方法不专门用于

计算机视觉，并且在任何配对的数据集样本上操作

;

在

我们的实验中，我们使用随机变换来从每个图像中获

得一对。经过训练的网络直接输出语义标签，而不是

需要外部处理才能用于语义聚类的高维表示。我们的

目标只是为了最大限度地提高每对课堂作业之间的互

信息它很容易实现，并且严格基于信息论，这意味着

我们可以毫不费力地避免其他聚类方法容易受到的退

化解决方案除了完全非监督模式，我们还测试了两个

半监督设置。第一个在

STL 10

分类上实现了

88.8%

的准

确率，在所有现有方法（无论是监督，半监督还是无

监督）上建立了新的全球最先进水平。第二个显示的

鲁棒性减少

90%

的标签覆盖率，相关的应用程序，希

望利用少量的标签。

github.com/xu-ji/IIC

介绍

大多数监督式深度学习方法需要大量手动标记的数

据，这限制了它们在许多场景中的适用性。这对于大

规模图像分类是正确的，对于分割（逐像素分类）更

是如此，其中每个图像的注释成本这是非常高的

[38，21]。另一方面，无监督聚类的目标是将数据点

完全分组到类

图1：在完全未标记的数据上使用IIC训练的模型学习聚类图像（顶

部，STL 10）和补丁（底部，波茨坦3）。找到的原始聚类直接对应

于语义类（狗、猫、卡车、道路、植被等）。以最先进的精确度训

练是端到端的，随机初始化，在任何阶段都不使用任何技巧。

没有标签[25]。许多作者试图将成熟的聚类算法与深

度学习相结合，例如通过使用k-means风格目标进行自

举网络训练[51，24，7]。然而，简单地组合聚类和表

示学习方法通常会导致退化的解决方案[7，51]。正是

为了防止这种退化，繁琐的管道-涉及预训练，特征后

处理（白化或PCA），网络外部的聚类机制-已经发展

[7，17，18，51]。

在本文中，我们介绍了不变信息聚类（IIC），一种

方法，解决这个问题，在一个更原则的方式。IIC是一

种通用的聚类算法

9865

下载后可阅读完整内容，剩余9页未读，立即下载

cpongm

粉丝: 6

无监督图像分类与分割：基于不变信息聚类的神经网络方法

基于Python的不变信息聚类技术在图像分类和分割中的应用

IIC-3: PyTorch实现的无监督图像分类与分割新突破

无监督分层语义分割：多视角共分割与聚类变压器

Python-用于无监督图像分类和分割的不变信息聚类

用于无监督图像分类和分割的不变信息聚类-Python开发

基于优化遗传算法的模糊聚类图像分割算法1

计算机研究 -基于图像整合和模糊聚类的SAR图像变化检测.pdf

基于聚类分割和形态学的可见光与SAR图像配准

K均值聚类分割的多特征图像检索方法

基于迭代密度聚类以及SURF算子的多个弱小目标检测

最新资源