开放集条件下的贝叶斯语义实例分割方法

196 浏览量更新于2024-06-20 收藏 1.55MB PDF 举报

"开集下的贝叶斯语义实例分割" 在计算机视觉领域，语义实例分割是一项重要的任务，旨在识别图像中每个像素所属的类别并进行实例区分。传统的语义实例分割方法依赖于全面的类别注释，这在实际应用中往往难以实现，特别是在开集条件下，即图像可能包含训练时未见过的未知类。这篇论文探讨了如何在这样的环境中进行有效的语义实例分割。论文中提出的开集语义实例分割方法利用贝叶斯框架来处理已知和未知类别的分割问题。贝叶斯方法允许模型在给定观察数据的情况下更新对未知参数（在这里是未知类别）的先验知识，形成后验分布。由于后验分布可能非常复杂，研究者采用模拟退火和ING优化来近似这一分布，并通过一个图像分区采样器来处理实例分割。这种方法的关键创新在于它能够利用已知类别的对象检测器（如Mask-RCNN或YOLO9000）的输出作为输入，对图像进行分割，同时也能处理未在训练集中出现的未知类。这意味着系统不仅能识别和分割已知类别，还能对未知类别进行合理的分割，从而提高场景理解的全面性。实验结果显示，该方法在已知类别上与监督方法具有竞争力，同时在处理未知类别时，相比于无监督方法也有良好表现。这表明其在处理开集条件下的场景理解任务时具有较强的泛化能力。论文的关键词包括实例分割、开集条件，强调了研究的核心关注点。作者们指出，尽管深度学习在语义分割和对象检测方面取得显著进步，但它们对未知类别的处理能力有限，而他们的工作则试图解决这一问题，使模型能够适应不断变化的环境，提高自主系统的场景理解性能。图1展示了该方法的工作原理，它能够分割所有图像区域，无论这些区域属于已知还是未知类别，已检测到还是未检测到。通过这种方法，语义实例分割不仅可以提供更准确的类别信息，还能捕捉到图像中的复杂关系，这对于自动驾驶系统和其他需要理解整个场景的应用至关重要。这项研究为开集环境中的语义实例分割提供了一种新思路，通过贝叶斯方法和优化技术，实现了对已知和未知类别的有效分割，提高了场景理解的鲁棒性和全面性。这为未来的计算机视觉研究开辟了新的方向，尤其是在应对开放世界挑战时。

T.作者：J.J. M. G.卡内罗岛里德

然后使用面来使用分水岭变换算法将图像分割成对象实例

现有实例分割方法的共同缺点是它们需要由注释掩码组成的强监

督信号在训练过程中使用的已知对象。相比之下，我们的贝叶斯实

例分割方法不一定需要这样的对象注释掩码，同时能够分割所有对象

实例，而不管它们是否已被检测到并且来自已知或未知类。

无监督分割：与基于学习的分割相比，无监督分割方法[6，15，26]

能够在没有上述强监督训练信号的情况下发现未知对象。然而，这些

方法通常对视觉对象做出强有力的假设（例如，它们往往具有相似的

颜色、纹理并共享强边缘），因此依赖于诸如颜色、深度、纹理和边

缘的低级图像线索来进行分割。因此，他们的结果往往相对不准确。

相比之下，我们的分割方法结合了最好的两个世界使用一个统一的公

式。特别地，我们的方法利用先前的对象位置（例如，由对象检测器

给出）来改善整体图像分割。同时，我们的方法不需要所有对象实例

的昂贵的分割掩模进行训练。

开集语义实例分割

设

：

Ω

→ R是定义在离散像素网格上的输入图像

Ω

{

，

. . .

}

，

即，是像素

处的颜色或强度。语义实例分割的目标是将图像I

分解成各

个对象实例区域（例如，椅子，监视器）和填充区域（例如，地板、天

花板）以及它们的语义标签。特别地，寻求将图像

分割

成

个非重叠

区域

Ω

，

∩

，

（1）

以及将每个区域

∈

分配给语义标签

。与语义分割任务不同，这里

的区域不应包含同一类的多个对象实例。然而，区域可以不是连续

的，因为遮挡可以将区域分成断开的片段。

开放集条件下的贝叶斯语义实例分割方法

贝叶斯定理实例

cs231n课程讲义合集

基于语义先验和深度约束的室内动态场景RGB-D SLAM算法.docx

概率图模型Probabilistic Graphical Model论文集7

贝叶斯非参数子模块化提升视频异常检测的可靠性

深入探索QuestionClassifier：基于5500数据集的问答分类技术

【高效语义分割秘诀】：TransUnet模型调优实战

语义分割中的深度学习技术：赋能像素级理解

贝叶斯推断在计算机视觉中的应用：图像分类与目标检测

使用NLTK实现语义角色标注

最新资源