图像间显著性关联在弱监督语义分割中的应用

0 下载量 157 浏览量 更新于2024-06-20 收藏 1.12MB PDF 举报
"弱监督语义分割中的图像间显著性关联" 在计算机视觉领域,语义分割是一项关键任务,它涉及到对图像中的每个像素进行分类,以标识出不同对象和背景。近年来,深度学习,尤其是卷积神经网络(CNN),在提升语义分割的准确性上取得了显著的进步。然而,这些技术的高精度往往依赖于大量像素级别的标注数据,这在实际操作中成本高昂。 弱监督语义分割正是为了解决这个问题,它只需要较少的监督信息,如图像级标签,而不是像素级标签。在这种情况下,如何有效利用这些有限的标签信息成为了一大挑战。本文提出了一种利用图像间显著性关联的方法来解决这个问题。 首先,文章中提到使用一个实例级的显著对象检测器,这个工具可以在训练图像中自动识别出可能的对象实例,即候选对象。这些显著实例提供了关于图像内容的初步理解。接着,通过提取这些显著实例的相似性特征,构建了一个相似性图。这个图表示了训练集中所有显著实例之间的关系。 随后,应用图划分算法将这个相似性图分割成多个子图,每个子图对应一个特定的关键字(或标签)。这种方法考虑了实例间的全局关系,有助于更准确地分配标签。此外,通过引入注意力信息,该算法还能自我校正,从而提高结果的准确性。 文章强调了其框架的普适性,可以与任何先进的全监督网络结构结合,用于学习分割网络。在与DeepLab等语义分割模型结合时,该方法在PASCAL VOC 2012数据集上达到了显著的性能提升,比现有的弱监督方法高出6%的mIoU(Intersection over Union)。 不仅如此,作者还进一步扩展了这种方法,将其与Mask R-CNN结合,实现了仅依靠关键字注释的弱监督实例分割,这是该领域的首次尝试。这些成果表明,利用图像间显著性关联和图划分策略,即使在弱监督条件下,也能实现高质量的语义分割和实例分割。 这篇论文提出了一种创新的弱监督语义分割方法,它通过实例级显著对象检测、相似性图构建和图划分算法,有效利用了图像级标签信息,提高了分割的准确性和效率。这种方法对于减少标注工作量,推动大规模图像分析具有重要意义。