对象实例挖掘:弱监督目标检测新框架

需积分: 10 4 下载量 104 浏览量 更新于2024-09-02 收藏 3.85MB PDF 举报
"这篇文档是商汤科技在AAAI2020年发表的研究论文,主要探讨了弱监督目标检测(Weakly Supervised Object Detection, WSOD)领域的一个新方法——对象实例挖掘(Object Instance Mining, OIM)框架。该框架旨在解决仅使用图像级注释进行WSOD时容易陷入局部最优的问题,以及由此导致的目标实例丢失,从而提高WSOD的性能。" 在计算机视觉领域,弱监督目标检测是一种重要的技术,它允许系统在只有图像级别标签(即没有特定对象边界框或实例标签)的情况下学习识别和定位目标。近年来,由于其在数据标注成本和效率方面的优势,WSOD受到了广泛的关注。然而,现有的基于多实例学习的方法存在一个关键问题:它们倾向于从图像中最具区分性的对象学习,这往往导致对其他可能存在的目标实例的忽视,从而陷入局部最优状态,降低了检测的准确性。 针对这一问题,论文提出了OIM框架,这是一个端到端的对象实例挖掘解决方案。OIM通过构建空间图和外观图上的信息传播机制,尝试检测图像中的所有可能对象实例,无需任何额外的注解信息。在迭代学习过程中,OIM能够逐渐发现并学习图像中所有对象实例,不仅减少了漏检的可能性,还能逐步优化模型的学习效果。 在OIM框架中,信息传播过程是关键。通过空间图,模型可以捕捉不同对象实例之间的空间关系,而外观图则帮助模型理解不同区域的视觉特征。这两个图的结合使得OIM能更全面地学习图像中的信息,避免只关注最显著的目标,从而有效地挖掘出图像中所有可能的对象实例。 此外,论文还可能涉及OIM框架的具体实现细节,如损失函数的设计、优化算法的选择、以及实验验证和与其他现有方法的对比分析。这些内容可能包括训练过程中的性能指标、泛化能力评估,以及在多个基准数据集上的实验结果,以证明OIM的有效性和优越性。 这篇论文提出了一种新的弱监督目标检测策略,通过对象实例挖掘解决了传统方法的局限性,提升了模型在有限标注条件下的目标检测性能,对于推动WSOD领域的发展具有重要意义。