图像间显著性关联在弱监督语义分割中的应用

141 浏览量更新于2024-06-20 收藏 1.12MB PDF 举报

"弱监督语义分割中的图像间显著性关联" 在计算机视觉领域，语义分割是一项关键任务，它涉及到对图像中的每个像素进行分类，以标识出不同对象和背景。近年来，深度学习，尤其是卷积神经网络（CNN），在提升语义分割的准确性上取得了显著的进步。然而，这些技术的高精度往往依赖于大量像素级别的标注数据，这在实际操作中成本高昂。弱监督语义分割正是为了解决这个问题，它只需要较少的监督信息，如图像级标签，而不是像素级标签。在这种情况下，如何有效利用这些有限的标签信息成为了一大挑战。本文提出了一种利用图像间显著性关联的方法来解决这个问题。首先，文章中提到使用一个实例级的显著对象检测器，这个工具可以在训练图像中自动识别出可能的对象实例，即候选对象。这些显著实例提供了关于图像内容的初步理解。接着，通过提取这些显著实例的相似性特征，构建了一个相似性图。这个图表示了训练集中所有显著实例之间的关系。随后，应用图划分算法将这个相似性图分割成多个子图，每个子图对应一个特定的关键字（或标签）。这种方法考虑了实例间的全局关系，有助于更准确地分配标签。此外，通过引入注意力信息，该算法还能自我校正，从而提高结果的准确性。文章强调了其框架的普适性，可以与任何先进的全监督网络结构结合，用于学习分割网络。在与DeepLab等语义分割模型结合时，该方法在PASCAL VOC 2012数据集上达到了显著的性能提升，比现有的弱监督方法高出6%的mIoU（Intersection over Union）。不仅如此，作者还进一步扩展了这种方法，将其与Mask R-CNN结合，实现了仅依靠关键字注释的弱监督实例分割，这是该领域的首次尝试。这些成果表明，利用图像间显著性关联和图划分策略，即使在弱监督条件下，也能实现高质量的语义分割和实例分割。这篇论文提出了一种创新的弱监督语义分割方法，它通过实例级显著对象检测、相似性图构建和图划分算法，有效利用了图像级标签信息，提高了分割的准确性和效率。这种方法对于减少标注工作量，推动大规模图像分析具有重要意义。

范若尘，侯启斌，程明明

相关工作

虽然长期的研究已经考虑了完全监督的语义分割，

例如，

[5，27，29，46，

47]，最近，弱监督语义分割已经脱颖而出。早期的工作，如[41]依赖于手工制

作的特征，如颜色，纹理和直方图信息来构建图形模型。然而，随着卷积神经

网络（CNN）方法的出现，这种传统方法已经逐渐被取代，因为它在具有挑战

性的基准测试中的性能较低[11]。因此，我们只讨论基于CNN的弱监督语义分

割工作在[32]中，Papandreou

等人

使用期望最大化算法[8]来基于注释的边界框和

图像级标签执行弱监督语义分割。类似地，Qi

等人。

[36]使用多尺度组合分组

（MCG）[35]生成的建议来帮助定位语义上有意义的对象。涂鸦和点被进一步

用作额外的监督。在[26]中，Lin

等人

利用基于区域的图形模型，通过涂鸦提供

地面实况注释来训练分割网络。 Bearman

等人

[2]类似杠杆

从人工标注的点获取知识作为监督。

其他作品仅依赖于图像级标签。Pathak

等人。

[33]通过引入一系列约束来解决

弱监督语义分割问题Pinheiro

等人

[ 34]将这个问题视为多实例学习问题。在[23]

中，设计了三个损失函数来逐渐扩大注意力模型[48]所定位的区域。 Wei

等人

[ 42]使用对抗擦除方案改进了这种方法，以获得更有意义的区域，从而为训练提

供更准确的启发式线索。在[43]中，Wei

等人

提出了一个简单到复杂的框架，该

框架使用[6，21]中的方法产生的显着图作为初始指南。侯

等人。

[19]通过将显着

图[18]与注意力图[45]相结合来改进这种方法。最近，Oh

等人。

[31]和Chaudhry

等人。

[4]考虑将显着性和注意线索联系在一起，但他们采用不同的策略来获得

语义对象。Roy和Todorovic[38]利用自下而上和自上而下的注意力线索，并通过

条件随机场将它们融合为循环网络。最近的工作[17，22]使用来自互联网的图像

或视频解决了弱监督语义分割问题。尽管如此，用于获得启发式线索的想法是类

似的那些在以前的作品。

在本文中，不同于所有上述方法，我们提出了一个弱监督分割框架，使用显

着的情况。我们将标签分配给显著实例，以生成用于完全监督分割网络的代理

地面实况。标签分配问题被建模为图分区，其中考虑了整个数据集中所有显着

实例之间的关系以及它们内部的信息。

概述和网络结构

我们现在提出一个概述我们的管道，然后讨论我们的网络结构和标签分配算

法。我们提出的框架如图所示。二、大多数以前的工作，依赖于像素级线索

（如显着性，边缘和注意力地图）regards实例歧视作为一个关键的任务。然

而，随着深发展

剩余17页未读，继续阅读

cpongm

粉丝: 6

图像间显著性关联在弱监督语义分割中的应用

基于卷积神经网络和语义相关的协同显著性检测.pdf

遥感图像语义分割.pdf

困难OoD数据提升弱监督语义分割性能

上下文解耦增强算法提升弱监督语义分割性能

图像显著性增强与分割处理技术探讨

半监督视频语义分割：帧间特征重建解决内部过拟合

边界控制的图像语义分割：一种场景分割新方法

图像语义分割实践系列文章：03 - 探究卷积神经网络（CNN）在图像语义分割中的作用

残差连接在图像语义分割中的应用

数据预处理技术在图像语义分割中的作用

最新资源