在具有挑战性的PASCAL VOC [14]和ImageNet [32]检测数据集上进
行了详细的实验我们的方法在所有这些数据集上获得了最先进的性
能,例 如 50
块
4%mAP 和 68
.
PASCAL VOC 2007数 据集 上的CorLoc为
4%,超过先前最佳性能方法3%以上
综上所述,我们的主要工作贡献如下。
–
我们 确认 CNN 包含 潜在 的对象 位置 信息 , 我们 利 用它 来 生成
WSOD的建议。
–
我们提出了一个两阶段的区域建议网络,用于WSOD中的建议生
成,其中第一阶段利用早期卷积层的低级信息来生成建议,第二
阶段是基于区域的CNN分类器,用于改进第一阶段的建议。
–
我们采用交替训练策略[30]在建议网络和WSOD网络之间共享卷积
计算以测试效率,因此建议网络和WSOD网络被集成到单个网络
中。
–
我们的方法在WSOD的PASCAL VOC和ImageNet检测数据集上获
得了最先进的性能
2
相关工作
弱监督 对象 检测/定位。 WSOD近年来引起了极大的关注[4、5、
9、12、20、21、34、38、39、41、42]。大多数方法采用三步流水
线:建议生成、建议特征提取和建议分类。基于该流水线,已经引入
了许多变体来给出更好的建议分类,
例如
,基于多实例学习的方法
[4,9,34,39,42]。最近,受CNN的巨大成功的启发,许多方法通
过集成最后两个步骤(
即
:建议特征提取和建议分类)到单个网络中
[5,12,21,38]。这些网络显示出更有前途的结果比一步一步的。然
而,这些方法中的大多数使用现成的方法[40,46]用于建议生成步
骤。与他们不同的是,我们提出了一个更好的建议生成方法WSOD。
更具体地说,我们提出了一个弱监督区域建议网络,它通过在弱监督
下训练的CNN生成对象建议,并将建议网络和WSOD网络集成这与
Diba
等人
的工作有关。[12]他们提出了一个级联卷积网络来选择一些
最可靠的WSOD建议。他们首先通过边缘框[46]生成一组建议,然后
根据[44]的类激活图或[2]的分割图这些选择的建议用于训练多个实例
学习分类器。与它们不同的是,我们使用CNN来生成建议,并使用基
于区域的CNN分类器来改进建议事实上,他们的网络可以用作我们的
WSOD网络。
最近,一些研究显示了类似的直觉,即在弱监督下训练的CNN包
含对象位置信息,并试图定位对象。