超像素采样网络：深度学习驱动的可微分超像素分割模型

37 浏览量更新于2024-06-20 收藏 2.67MB PDF 举报

"本文介绍了一种名为超像素采样网络（Superpixel Sampling Network，简称SSN）的新型深度学习模型，由Varun Jampani、孙德清、刘明宇、杨明轩和Jan Kautz等人开发。SSN旨在解决现有超像素算法不可微分的问题，使其能够融入端到端的深度神经网络中，用于学习任务特定的超像素分割。该网络允许使用灵活的损失函数进行训练，并在保持高效运行时间的同时，提高了超像素分割的性能。实验结果显示，SSN不仅在传统的分割基准上超越了现有的超像素算法，还能用于其他视觉任务的学习，并能提升下游深度网络的性能。" 本文主要探讨了超像素在计算机视觉领域的应用以及与深度学习结合的挑战。超像素是一种有效的图像低/中级别表示，通过对像素进行分组形成感知上有意义的区域，减少了后续任务的数据处理量。尽管超像素在众多领域如对象检测、语义分割、光流估计等都有广泛应用，但其与深度学习的融合却相对较少。主要原因在于标准卷积运算在规则网格上的限制，以及现有的超像素算法不具备可微分性，无法直接纳入深度网络的训练过程。为了解决这个问题，研究者提出了超像素采样网络（SSN）。SSN是一个可微分的模型，它利用深度网络学习超像素分割，实现了端到端的训练，允许任务特定的超像素学习，并且具备快速的运行时间。通过广泛的实验，SSN不仅在超像素分割基准测试中表现出色，而且在学习其他视觉任务时也表现出优越性能。此外，SSN可以轻松地整合到下游深度网络中，进一步提升整体系统的表现。 SSN的工作流程如图1所示，输入图像首先通过深度网络进行处理，然后生成超像素分割。这种创新的方法为深度学习和超像素的结合开辟了新途径，为未来的计算机视觉研究提供了强大的工具。通过将超像素分割与深度学习的强大学习能力相结合，SSN有望推动在高效率和高精度之间找到更好的平衡，从而促进更多视觉任务的解决方案。

Jampani

等人

我

深度聚类。受深度学习在监督任务中的成功启发，有几种方法研究了使

用深度网络进行无监督数据聚类。最近，

Greff et. al. [17]

提出了神经期

望最大化框架，其中他们使用深度网络对聚类标签的后验分布进行建

模，并展开

过程中的迭代步骤进行端到端训练。在另一项工作

[16]

中，梯形网络

[31]

用于建模聚类的分层潜变量模型。赫尔希

等等人

[19]

提

出了一种用于分离和分割音频信号的基于深度学习的聚类框架。

Xie

等人

al. [40]

提出了一个深度嵌入的聚类框架，用于同步学习特征表示和聚类

分配。在最近的一份调查报告中，

Aljalbout et. al. [3]

给出了基于深度学

习的聚类方法的分类。在本文中，我们还提出了一种基于深度学习的聚

类算法。与以前的工作不同，我们的算法是专为超像素分割任务，我们

使用图像特定的约束。此外，我们的框架可以很容易地结合其他视觉目

标函数来学习特定于任务的超像素表示。

预赛

SSN

的核心是一种受

SLIC [1]

超像素算法启发的可微聚类技术。在这里，我

们在下一节描述我们的

SSN

技术之前简要回顾一下

SLICSLIC

算法是最简单

也是最广泛使用的超像素算法之一。它易于实现，具有快速的运行时间，并

且还产生紧凑且均匀的超像素。

虽然

SLIC

算法有几种不同的变体

[25

，

27]

，但在原始形式中，

SLIC

是在

五维位置和颜色空间（通常是缩放

的

XY Lab

空间）中对图像像素执行的

均

值聚类。形式上，给定图像

∈

，

在

个像素处具有

维

XY Lab

特征，超

像素计算的任务是将每个像素分配给

个

超像素之一，即，计算像素

超像

素关联映射

∈ {

，

···

，

}

。

SLIC

算法如下操作首先，在

维空间中选取初始聚类（超像素）中心

∈

这种采样通常是在像素网格上均匀进行的，并具有一些局部扰

动，

图像梯度给定这些初始超像素中心

，

SLIC

算法在每次迭代t中以迭代方

式进行以下两个步骤：

像素

超像素关联

：将每个像素关联到五维空间中最近的超像素中心，

即，计算每个像素

处的新超像素分配，

arg min

i ∈{

，

…m−

}

D（I

，

−

）

，

（

）

当

不具有D（a，b）上的

t i

时

−

二

、

超像素中心更新

：每个像素内的平均像素特征（

XY Lab

）

每像素聚类以获得新的超像素聚类中心S

。对于每一个超级

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

超像素采样网络：深度学习驱动的可微分超像素分割模型

超像素分割算法亲测可用

超像素分割

深度学习，神经网络，人像分割，训练测试可用

使用深度学习进行皮肤病变分割：在深度学习中使用深度神经网络进行皮肤病变分割，语义分割-matlab开发

基于深度学习的语义分割网络.pdf

RGB-D显著对象检测：超像素原型采样网络的创新与挑战

深度学习语义分割模型FCN在PyTorch中的实现

医学U-Net实战：深度学习在图像分割中的应用

MATLAB深度学习实战：构建和训练神经网络模型

从特征提取到模型训练：深度学习如何助力语音识别

最新资源