大规模语义概念分割：弱监督与零样本学习方法

96 浏览量更新于2024-06-20 收藏 1.62MB PDF 举报

概念面具：大规模语义概念分割是一项前沿的计算机视觉技术，旨在解决传统的语义分割任务中遇到的挑战，即处理大量复杂的标签。以往的工作往往局限于几十到几百个类别的标注，但在现实应用中，特别是对于识别对象、部件、材料等无限数量的概念，这显然是不足的。本文的主要创新点在于提出了一种能够适应大规模语义概念分割的系统，采用了一种弱监督和半监督的学习框架。首先，研究者利用深度神经网络在拥有6M图像但仅提供图像级标签的大型数据集上进行训练，着重学习18K个视觉语义嵌入。这一步骤有助于捕捉图像中的基本概念表示，尽管标签信息有限，但通过深度学习的自适应性，模型能学到丰富的上下文信息。接着，他们进一步改进和扩展了嵌入网络，引入了cu-等级数据集，该数据集带有750个概念的边界框注解，用于精细化注意力地图的预测。这种方法不仅提升了模型对具体概念的理解，还增强了其对细节的关注。最后，为了验证系统的全面性能，研究团队利用一个80类完全注释的数据集训练了一个基于注意力的类别未知分割网络。这种方法确保了模型在面对复杂场景和未标记的概念时，仍能保持较高的分割精度。整个框架的核心在于其灵活性和适应性，能够在缺乏详尽标注的情况下，有效地处理大量概念的分割任务。通过弱监督和零样本学习，该系统能够在一定程度上缓解标注成本高的问题，这对于实际应用，如自动驾驶、图像检索和智能分析等领域具有重要意义。关键词：“概念面具”、“大规模分割”、“半监督学习”、“弱监督学习”和“零样本学习”揭示了这项工作的关键点，它不仅推动了语义分割领域的边界，也为未来处理大规模、多标签的图像理解问题提供了新的可能性。

Y. Wang，Z.Lin，X.Shen，J，Zhang和S.科恩

在具有少量标签的数据集上表现良好，例如PASCAL VOC

[9]ADE20K有20个对象类，ADE20K有150个对象类。

例如，需要分割单个对象实例的实例感知分割，基于区域建议的

方法[29]在具有80个对象类的COCO数据集上表现良好[22，8，11]。然

而，基于区域提议的方法只能处理对象类，并且它们到诸如对象部分

或材料的其他概念的生成并不简单。

这些方法都是完全监督的，并且假设不相交的类，这使得能够训

练具有区分性软最大损失的分割网络。

弱/半监督语义分割为了减少全监督方法中所需的标记工作，已经提

出了弱监督分割方法[20，30，3，14，28，17，7]。图像级注释需要最

少的人工努力，但是与完全监督的方法相比，具有这种注释的方法具

有很大的性能差距;利用诸如边界框注释的附加标签类型来提高性

能。另一方面，一些作品利用来自网络的补充数据[14]。这些弱监督

方法仍然集中在一小部分不相交的标签上。

与这些工作不同，本文的目的是规模语义分割到一个非常大的类

别。我们利用几个数据集中所有可用的注释，从而结合不同层次的注

释。

与我们的模型相关的一项工作是由Hong

等人完成

的。[13]第10段。

分割被分解成两个任务，两个独立的网络：分类和分割。分类网络使

用图像级注释，并且分割网络使用像素级注释。然而，他们的工作仍

然集中在非常少的标签上，他们的模型不能推广到看不见的概念。

另一个最近的工作与我们的是由胡

等

。[15]第10段。它的目的是在

大量的类别与掩模注释的一小部分和大部分框注释的实例分割。相比

之下，我们的工作不仅旨在分割对象，而且还分割其他概念，如材

料，部件和视觉属性（如颜色）;我们的模型被学习来分割仅用图像

级监督训练的概念，并且甚至可以处理看不见的概念。

零次学习对于零次学习的问题，通过从训练的类别中转移知识来测试

看不见的类别与类标签相关联的向量的语义嵌入是从对象属性标签

[16，27，21]或从语言任务[10，32，26]中学习的单词嵌入中Zeroshot

学习也可以应用于分割任务。通过将图像映射到单词嵌入空间的嵌入

网络，分割模型有可能在给定未知概念的情况下生成掩码[35]。

大规模分割/解析Zhaoet al.旨在使用开放词汇识别和分割对象[35]，

这符合我们的大规模分割目标文字和图像被嵌入到一个关节空间

中，以允许

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

大规模语义概念分割：弱监督与零样本学习方法

湘东傩面具：神秘的古老表情

防毒面具：托管OS X的文件管理器

给我一个面具：마마스크서비서비스

面具背后：雇员评价中的政治因素.PPT

hr10面具背后：雇员评价中的政治因素.pptx

面具背后：雇员评价中的政治因素分析.pptx

面向单阶段弱监督语义分割_Towards Single Stage Weakly Supervised Semantic Seg

初中语文文学讨论名著导读面具馆：阴谋啊阴谋让人迷醉

初中语文文学讨论名著导读面具馆：难得一见的知性光芒

面具

最新资源