C-WSL:计数引导提升弱监督定位

0 下载量 160 浏览量 更新于2024-06-20 收藏 3.64MB PDF 举报
"C-WSL:计数引导的弱监督定位方法,利用计数监督提升区域选择质量,以改进弱监督定位(WSL)在对象检测任务中的表现。通过基于计数的区域选择算法,选择覆盖单个对象实例的高质量区域,从而优化现有的WSL架构。实验表明,C-WSL在VOC2007和VOC2012数据集上显著优于现有方法,同时减少了注释时间和人工成本。" 在计算机视觉领域,对象检测是一个关键任务,而卷积神经网络(CNN)在此方面取得了显著的进步。然而,依赖于精确边界框标注的强监督方式需要大量的人工努力。为了解决这个问题,弱监督定位(Weakly Supervised Localization, WSL)应运而生,它仅需图像级别的类别标签作为监督信号。尽管这种方法大大减少了标注需求,但在检测性能上仍与强监督方法存在差距。 C-WSL(Count-Guided Weakly Supervised Localization)是一种创新的WSL方法,它引入了计数监督的概念。C-WSL利用每类对象的数量信息,将此信息作为训练过程中的新监督形式。通过一个简单的基于计数的区域选择算法,C-WSL能够挑选出包含单一对象实例的高质量区域,这些区域在训练过程中被用于更新模型,从而提高检测的准确性。 在传统的WSL中,模型可能会学习到模糊的类别分布,导致检测区域的不准确。C-WSL通过强调单个对象实例,有助于减少这类问题。它被整合到现有的WSL框架中,通过选取的高质量区域,强化了模型对对象实例的理解和定位能力。 实验结果显示,C-WSL在PASCAL VOC2007和VOC2012数据集上的表现明显优于其他先进的WSL方法。值得注意的是,相比于只标注图像类别,获取每类对象的计数信息只需要适度的额外时间。此外,与中心点击或边界框注释相比,C-WSL的注释时间减少了2倍以上,大大降低了人工成本。 C-WSL提供了一种有效的方法,通过利用计数信息改进WSL的性能,降低了对精确边界框注释的依赖,同时也减轻了数据标注的工作量。这一创新方法对于推动弱监督对象检测技术的发展具有重要意义。