没有合适的资源?快使用搜索试试~ 我知道了~
强化WSOD:利用负确定性信息提升弱监督对象检测性能
+v:mala2277获取更多论文关于我们绝对错误使更好:通过负确定性信息王冠春1,张向荣1,彭泽林1,唐旭1,周惠宇2,焦立成1,西安电子科技大学2莱斯特大学gwang 2,stu.xidian.edu.cn,xrzhang,mail.xidian.edu.cn,tangxu128@gmail.com,hz143@leicester.ac.uk摘要弱监督对象检测(WSOD)是一项具有挑战性的任务,其中图像级标签(例如,整个图像中的实例的类别)用于训练对象检测器。许多示例方法遵循标准的多实例学习(MIL)范式,并取得了良好的性能。然而,由于缺乏确定性信息,导致部分支配和丢失实例。为了解决这些问题,本文着重于识别和充分利用WSOD中的确定性信息。我们发现,负面的情况(即绝对错误的情况),在大多数的研究中被忽视,我们的研究通常包含有价值的决定性信息。基于这一观察,我们在这里提出了一个负确定性信息(NDI)的基础上,提高WSOD的方法,即NDI-WSOD。具体来说,我们的方法包括两个阶段:NDI收集和开发。 在收集阶段,我们设计了几个过程来识别和提取的NDI从负面的情况下在线。在开发阶段,我们利用提取的NDI构造了一种新的负向对比学习机制和负向引导的实例选择策略,用于处理部分支配和缺失实例的冲突,并进行了实例检索。在VOC2007、VOC 2012和MS COCO等几个公共基准测试上的实验结果表明,该方法取得了令人满意的性能。1介绍随着计算机视觉的快速发展,物体检测引起了广泛的关注 [Girshick , 2015;Renet al. , 2015;Redmonet al. ,2016]。然而,这些方法中的大多数依赖于实例级注释数 据 中 的 强 监 督 [Everinghamet al. , 2010;Linet al. ,2014],这需要巨大的人力和时间消耗。为了解决这个问题,一些弱监督对象检测(WSOD)方法[Bilen和Vedaldi,2016;联系作者图1:每个正反实例之间的特征相似性的可视化。收集训练过程中产生的负面实例对于每个提议,我们计算其本身与其类别特定的负面实例之间的余弦相似度,然后将最大值作为热图得分。Tang等人,2017; Linet al. ,2020; Ren等人,2020],其中仅需要图像级注释。大多数现有的WSOD方法遵循标准的多实例学习(MIL)管道将WSOD转换为多标签分类任务。然而,由于缺乏准确的实例级注释,这些方法有两个限制。一方面,只有图像分类任务可以被构造为提供监督信息,导致区别性部分支配问题,由此难以确定边界框是否包含完整的对象[Zenget al. ,2019;Renet al. ,2020],特别是对于非刚性物体,例如狗和猫。另一方面,现有方法通常对最高置信度的建议进行采样以生成用于训练系统的实例细化分支的伪标签,同时忽略其他潜在对象,导致错过检测[Linet al. ,2020]。为了解决上述问题,Ren等 人 [Renet al. , 2020] 设 计 了 一 个 数 据 驱 动 的 空 间dropout块来发现完整的对象。Lin等人[Lin等人,,2020]通过在空间和外观图上引入标签传播来挖掘更多潜在的对象以生成伪标签。然而,利用不可靠的监督工具(即不确定每个提案arXiv:2204.10068v1 [cs.CV] 2022年4月+v:mala2277获取更多论文虽然如此,上述限制仍然存在。为了应对这一挑战,我们从不可靠的监督绕道而行,旨在利用WSOD中有价值的确定性信息来提高系统性能。受[Kimet al. ,2019],则可以直接确定提案不属于哪一类别。例如,如果当前图像标签是狗,而某些实例被预测为猫,则表明这些实例是绝对错误的,不属于猫,这是一种确定性信息。这些包含确定性信息的实例被称为负反馈。图1揭示了我们有趣的发现,否定实例总是包含特定于类别的区别特征。如图1所示,可以建立对象区域及其否定实例之间的高特征相似性,而对象的其余部分可以被忽略。我们认为,这种无知是由于过度拟合的歧视性区域(如狗和鸟的头),检测器往往会产生错误的预测,在区域包含类别歧视性功能。这种有价值的负面实例信息被称为负面确定性信息(NDI)。如何充分利用NDI可能是提高系统性能的关键为此,我们建议NDI-WSOD充分利用负面情况来解决上述问题。从技术上讲,NDI-WSOD包括收集阶段和开发阶段。在收集阶段,我们的目标是挖掘在训练阶段产生的负面实例,然后提取它们的NDI。如上所述,这些前NDI可以被视为错误分类类别的判别特征。我们在这里构造一个特征库来存储这些特征以供以后使用。然后,针对NDI中存在的判别部分支配和实例缺失问题,提出了一种新的负对比学习(NCL)机制和负引导实例选择(NGIS)策略。NCL将NDI作为模板来检测过拟合的区分区域,然后减少它们的影响,将检测器从区分部分支配问题中拉出来。与利用模型为了解决丢失实例的问题,NGIS选择尽可能多的前景实例用于实例细化,但通过利用收集的NDI作为标准来避免不必要的噪声,从而确保召回率和精度。我们的论文的贡献包括:• 我们发现WSOD中的否定实例可能包含有价值的确定性信息,并提出了一种有效的方案来在线收集这些实例中的NDI。• 利用收集到的NDI,我们设计了NCL和NGIS,分别解决了WSOD模型的区分部分支配和实例缺失问题• 在VOC 2007、VOC 2012和MS COCO数据集上的实验证明了该方法的有效性。2相关工作现有的WSOD方法通常是基于标准的MIL,它把每个图像作为一个包和一系列预先计算的建议作为实例。WSDDN [Bilen and Vedaldi,2016]将卷积神经网络与MIL相结合,广泛用作未来研究的基础。基于WSDDN的方法往往集中在显著对象的可区分区域,导致不完整或丢失检测。为了处理这些问题,OICR [Tanget al. ,2017]对最高置信度实例进行采样以构建伪标签,伪标签用于训练实例细化分支以进行更好的检测。从优化的角度来看,C-MIL [Wanet al. ,2019]平滑目标函数以减轻局部最优解的问题。利用不同转换下的特征一致性,CASD [Huangetal. ,2020年]取得优异成绩。为了增强伪标记生成,OIM [Linet al. ,2020]旨在通过在空间和外观图上引入信息来挖掘更积极的对象,例如细化分支,而MIST [Renet al. ,2020]采用了一种新颖的多实例自我训练策略。 与仅利用单个图像信息的上述方法不同,IM-CFB [Yinet al. ,2021]使用跨数据集的特定于类别的特征作为模板来遍历实例。传统的方法仍然依赖于不可靠的监督来指导检测器,不同的是,我们提出的NDI-WSOD旨在通过利用确定性信息来改进模型。近年来,对比学习在图像分类中引起了广泛的关注。Moco [Heet al. ,2020]采用动态记忆模块收集负样本,摒弃了批量大小限制,便于无监督对比学习。SCL[Khoslaet al. ,2020]提出了一种图像分类任务中的监督对比损失,其中类别信息用于构造正样本和负样本。 与需 要 构 造 阳 性 和 阴 性 对 的 上 述 方 法 不 同 , BYOL[Grilletal. ,2020]仅使用正样本来构建具有自蒸馏的师生模型以获得鲁棒的特征表示。与常用的对比学习方法不同,本文分析了WSOD的特点,提出了一种仅采用负样本的负对比学习机制,使模型远离局部最优。据我们所知,本文是第一次在同类应用对比学习WSOD。3该方法所提出的方法的总体架构如图2所示。我们采用一个MIL分支和一个实例精化分支作为基本网络,并将所提出的NDI-WSOD(包括收集和开发阶段)集成到框架中。在收集阶段,我们检查训练过程中产生的负面实例,并从中提取NDI。在开发阶段,基于收集到的NDI,构造了一个负对比学习(NCL)机制和一个负引导实例选择(NGIS)策略,分别用于处理区分性部分支配和缺失实例+v:mala2277获取更多论文------Σi=1∈类别的数量对于第c个类别队列,b我我nsc+Sc我nsc+Sc1122LL图2:所提出的方法的架构。一个MIL分支和一个实例细化分支被用作基本网络。建议的NDI-WSOD首先使用收集阶段,从训练阶段产生的负面实例中提取NDI在此基础上,分别构造了NCL和NGIS来防止模型的判别性部分支配和丢失实例3.1预赛我们首先根据一般的WSOD框架建立一个基本网络[Bilen和Vedaldi,2016;Tanget al. ,2017],其由MIL分支和实例细化分支组成。MIL分支与WSDDN一致[Bilen和Vedaldi,2016],其中,给定输入图像I及其预先计算的建议B=b1,b2,. b N[Ui-Jlings等人,2013;Arbel a'ezetal. ,2014],对应-一组建议特征F=f1,f2,...,f N是不存在的。然后,将这些特征映射到建议分数S=Sb1, Sb2,...,S bN.接下来,通过对所有图像进行求和来计算类别c建议:φ c=φ|B|S c.然后,多标签分类NDI-WSOD挖掘了WSOD中有价值的确定性信息,即:NDI,然后我们建议利用信息,以提高系统的性能。NDI收集阶段我们首先设计了一个NDI收集平台来在线收集和提取NDI。在NDI收集阶段,我们的目标是自动挖掘否定实例,并从否定实例中提取类别特定的判别特征,这是一种确定性信息。[2019 - 04 - 25][2019 - 04][2019 -04] ,2021],采用特征库结构来存储所提取的NDI。形式上,收集模块包含C个队列{Q1,Q2,...,其中,C表示损失函数如下:Q c={(nf c,ns c),(nf c,ns c),., (nf c,ns c)},其中L是CLmil=− {yclogφc+(1−yc)log(1−φc)}(1)c=1例如细化分支,我们保持与[Tanget al. 2017年],以获得精确的检测。分支通过单层分类器将建议特征映射到细化的分数。特别是,在最后一次细化中添加了一个额外的回归分支,以在线回归框[Yanget al. ,2019]。实例细化分支用由[Renet al. ,2020],并且多任务损失计算如下:Lref=Lrefcls+ Lrefreg.(二)队列的长度Nf和Ns表示所收集的FEA。tures和相应的置信度(ns[0,1])。在培训阶段,我们监控来自MIL Branch的提案得分S,并识别以下方面的负面因素:根据图像级别标签的立场。然而,并非所有的负面例子都是有价值的。由于模型训练不足而产生的一些负面实例只包含噪声。为了保证NDI的质量,我们建议采取以下步骤。首先,设置置信度阈值τ,过滤掉由于模型缺陷而产生的无价值实例。保留的否定实例可以以高置信度被视为属于错误分类的类别。这些实例通常包括高比例的区分性类别特征。我们设置一个空队列,其中Lrefcls和Lrefreg是加权交叉熵收集建议的特点和错误分类的类别CON-这些事例的证据一旦充满信心,和Smooth-L1损失,其中如[Tanget al. ,2017]。在推理阶段,我们将所有细化分数的平均值作为每个提案的最终分数。3.2NDI-WSOD由于缺乏实例级监督,现有的WSOD采用动量更新(CMU)策略对队列进行更新,以从收集到的实例中提取高质量的NDI。CMU首先计算当前实例与其类别队列中的每个特征之间的余弦相似度,然后选择最相似的一个进行更新,如下所示:方法经常遭受歧视的部分支配和nsc Scnfc←i·nfc+new·fnew(3)inew inew缺少实例的问题。为了应对这两项挑战,+v:mala2277获取更多论文∗我新我ΣBJBJcosBJBJBJ|B|cosj=1cosNDI构造不同的样本对,同时将它们在表示空间中拉远,从而引导模型摆脱部分支配。给定一系列实例,我们首先用阈值τ过滤掉无价值的实例,就像收集阶段的第一步一样。接下来,我们计算每个实例与其对应的NDI之间的距离。为了简单起见,余弦相似度被用于计算。那么,NCL损失可以表示如下:|B|cbjL=α·nscbj·max.中国(5)图三: 实例选择策略的可视化。的NCL我的j=1我||fbjcbj|| · ||nfi||第1和第2行的图像级标签分别是cat和train。基线(这对图像的左边)比我们的其中α是ffactor,cbj的折衷建议的特点j和fbj是类别,伊拉克利翁NGIS避免噪音。哪里 fnew和Sc是特征和误分类-- 第10项建议,以及最接近的NDI的key。国家统计局cbjre评估了NDI中的区分特征,并且当前实例与NDI之间的特征相似性表示其概率。当前实例的类别置信度。对nsc执行相同的操作。遵循这种风格,进一步提取高质量的NDI。此外,我们设计了一个辅助损失,即负实例交叉熵(NICE)损失,以消除噪声的情况下,是不充分的训练。在仅使用图像级注释的情况下,难以确定实例是否属于当前类别。然而,很容易理解为什么一个实例不属于某些类别。因此,我们利用这种确定性信息为错误分类的实例构建NICE损失,如下所示:|B|Lnice=− I(Sneg> τ)·yneglog(1−Sneg)(4)区分区域的能力高相似性意味着实例应该受到显著的惩罚。如图2所示,bbox1包含比bbox2更高比例的区分区域,因此施加了大的损失,迫使模型寻找更完整的对象bbox2。在NCL的帮助下,可以检测更完整的对象。与通过利用模型对单个图像的响应来惩罚区域的传统方法相比(2)否定引导的实例选择:实例细化分支在现有方法中被广泛使用,j=1哪里|B|表示实例的数量,y neg表示第j个实例的误分类类别,S neg表示对应的置信度。建议的NICE损失使错误分类的实例得到优化,减少训练不足造成的噪声实例。通过上述步骤,可以获得高质量的NDI。NDI开发阶段利用收集的NDI,我们在这里提出了一个消极的对比学习机制和一个消极的指导实例选择策略,以减轻歧视性的部分domination和丢失的实例问题,分别。(1)负对比学习:由于只能构造一个多标签分类任务来提供超分类信息,所以只关注对分类任务有利的区域,这被称为区分部分支配问题。对于某些人来说,强迫模型惩罚过度聚焦的区域是很直观的伪标签生成,其中正实例选择起着关键作用。现有方法通常选择最高置信度对象作为正实例,同时忽略其他潜在对象,导致缺失实例[Tanget al. ,2017]。或者,人们选择前15%的建议作为积极的实例,这可以确保召回,但会引入更多的噪音[Renet al. ,2020]。为此,在现有NDI的基础上,我们设计了一个NGIS策略来处理这个问题。在消除过程之后,NGIS被设计为选择一个大的候选集合,然后过滤掉噪声。对于前者,NGIS使用类似于[Renet al.]的方法。,2020],其选择前15%的非重叠实例作为候选。由于这些候选人通常包括很多背景噪声,我们然后利用NDI去除噪声。考虑到肯定实例通常包含有区分区域的特征这一先验知识,我们采用NDI作为模板来仔细检查每个候选。具体来说,我们计算出精确识别过拟合区域和约束最大余弦距离在每个实例和其影响至关重要。我们观察到,NDI包含过拟合区域fea-NDI。然后,我们使用条件:dis b i过滤掉噪声实例 >β·1·β|B|迪斯布杰 . 如图3所示图可以被视为模板以匹配过拟合区域。为此,我们遵循对比学习范式,该范式利用每个实例及其相应的类别与[Renet al. ,2020],NGIS可以过滤掉复杂环境中的噪声,并保持大量的正实例,从而解决丢失的实例。改善系统成果。训练这个部门+v:mala2277获取更多论文图四:我们的NDI-WSOD的定性结果(对中的右侧图像)和基线(对中的左侧图像)位于虚线的左侧,其中失败的案例用红色框突出显示。右侧显示了性能改进最大的前5个类别。方法mAP(%)CorLoc(%)方法mAP(%)CorLoc(%)OICR [Tanget al. ,2017年]41.260.6OICR [Tanget al. ,2017年]37.962.1PCL [Tanget al. ,2018年]43.562.7PCL [Tanget al. ,2018年]40.663.2OIM [Linet al. ,2020年]50.167.2OIM [Linet al. ,2020年]45.367.1C-MIL [Wanet al. ,2019年]50.565.0C-MIL [Wanet al. ,2019年]46.767.4WSOD2[Zenget al. ,2019年]53.669.5WSOD2[Zenget al. ,2019年]47.271.9IM-CFB [Yinet al. ,2021年]54.370.7IM-CFB [Yinet al. ,2021年]49.469.6MIST [Renet al. ,2020年]54.968.8MIST [Renet al. ,2020年]52.170.9NDI-WSOD56.871.0NDI-WSOD53.972.2表1:与VOC 2007数据集上其他最新技术的比较。4实验和分析4.1数据集和评估遵循其他最先进的方法,我们在几个具有挑战性的目标检测基准上评估了我们的NDI-WSOD:VOC 2007,VOC 2012 [Everinghamet al. ,2010]和MS COCO [Linetal. ,2014]。对于VOC数据集,我们采用训练集进行训练 , 并 在 测 试 集 上 评 估 系 统 性 能 。 采 用 平 均 精 度(mAP)和正确定位(CorLoc)分别对模型的整体性能和定位能力进行 对于MS COCO,我们采用train2014集进行训练,并在val2014集上评估系统性能,其中mAP和mAP [. 五点。05:. 95.第95章被人欺负了吃了整体表现。 此外,mAPs、mAPm和mAP1分别用于评估小型、中型和大型对象4.2实现细节为了公平比较,选择性搜索[Uijlingset al. ,2013]和MCG[Arbe la'ezetal. , 2014] 用 于 VOC[E v e ringhametal. ,2010]和MS COCO [Linet al. ,2014],以分别生成提案。然后,整个模型在具有11 GB GPU内存的单个NVIDIA GeForce GTX 2080 Ti上进行训练,批次大小设置为4。初始学习率为0.0005,权重衰减为0.0005,动量为0.9的SGD对于VOC 2007、VOC 2012和MS COCO,总迭代次数分别设置为35,000、70,000、210,000。的表2:与VOC 2012数据集上其他最新技术的比较。方法mAP [. 五点。05:. 95]地图图s地图m图lPCL8.519.4---WSOD210.822.7---雾11.424.33.612.217.6NDI-WSOD12.126.23.713.219.3表3:与MS COCO数据集上其他最新技术的比较。相应的学习速率分别在第30,000、60,000、100,000步处减小10倍。对于数据增强,我们保持与最先进方法相同的策略,包括多尺度训练和随机水平翻转。收集阶段中的长度L和阈值τ分别设置为5和0.05在剥削阶段,因子α和β分别设置为0.3和3在训练阶段期间,Ltotal=Lmil+Lref+Lnice+Lncl。4.3与最先进技术的我们在VOC 2007,VOC 2012和MS COCO上评估了我们的方法,并与几种最先进的方法进行了比较。表1显示了 VOC 2007 数 据 集 的 整 体 性 能 。 结 果 表 明 , NDI-WSOD的mAP和CorLoc分别达到56.8%和71.0%,显著优于其他方法。特别是,与最先进的方法[Renet al. ,2020],NDI-WSOD分别以1.9%mAP和2.2%CorLoc实现了显著改善,证明了我们方法的优越性。+v:mala2277获取更多论文†L方法mAP(%)CorLoc(%)更新策略长度mAP(%)OICR†OICR<$ +NCLPCL <$PCL<$+NCL41.844.6(+2.8)46.248.8(+2.6)58.761.8(+3.1)64.466.8(+2.4)FIFO553.9CMU554.9CMU+Lnice556.8表4:VOC 2007数据集上的消融研究(表明我们的实施)。为了证明NDI-WSOD的鲁棒性,我们还在VOC 2012上评估了我们的方法表2分别显示了VOC 2012测试集和训练集的检测和定位结果可以看出,我们的NDI-WSOD实现了53.9%的mAP1和72.2%的CorLoc,其在mAP方面以至少1.8%的增量优于所有其他方法为了验证NDI-WSOD改善了检测IoU,我们在表3中报告 了 大 数 据 集 MS COCO 的 检 测 结 果 据 证 明 , NDI-WSOD优于其他方法,在mAP方面至少增加0.7%/1.9%[。五点。05:. 95]和mAP。 此外,我们评估-评估系统在不同目标尺寸下的性能在与[Renet al. ,2020],NDI-WSOD在不同的对象大小上表现得更好,特别是对于可能被部分检测到的大对象,表明我们的方法达到了预期。4.4消融研究各组分我们对VOC 2007进行了消融研究,以验证NDI-WSOD中每个组件 我们首先介绍了伪标签生成策略[Renetal. ,2020年]纳入我们的基础网络作为基线。如表4所示,与基线相比,添加NCL产生了显著改善,这使得mAP/CorLoc改善了3.1%/1.9%另一方面,采用NGIS使mAP/CorLoc提高了1.8%/1.1%,这表明采样更多的潜在对象有助于提高性能。集成所有模块后,系统实现了最佳性能,在mAP/CorLoc上显著优于基线,分别提高了3.9%/2.5%。为了验证NDI-WSOD的泛化能力,我们将NCL机制插入 到 经 典 的 OICR 中 [Tangetal. , 2017] 和 PCL [Tangetal. , 2018] 。 结 果 分 别 观 察 到 mAP/CorLoc 改 善2.8%/3.1%和2.6%/2.4%。此外,我们在图4中可视化了NDI-WSOD的检测结果,这表明NDI-WSOD在非刚性物体(例如猫,狗和人)上实现了显着的改进,并且在复杂场景中也令人满意,进一步证实了我们提出的方法的有效性。第1页http://host.robots.ox.ac.uk:8080/anonymous/OGCPWE.html表5:在VOC 2007测试集上构建NDI收集阶段的策略,以mAP(%)表示。图5:VOC 2007数据集上不同影响因子的检测结果NDI收集阶段一个简单而有效的先进先出(FIFO)策略被选为本实验的基线。如表5所示,应用CMU策略使mAP提高了1.0%。加入nice后,系统性能提高了1.9%mAP,这表明抑制噪声可以提高NDI的质量然后,分析了L.正如我们所看到的,与较大的L相比,较小的L将降低噪声容限,从而导致系统性能显著下降。影响因子对于NCL中的损耗因子α,图5显示了实验结果,其中α=0.3导致最佳结果,因为它在损耗之间实现了最佳平衡。对于NGIS中的因子β,结果表明β=3是最佳折衷。较大的β通常导致对象丢失。相反,较小的β不足以过滤噪声。值得注意的是,我们的NDI-WSOD对新引入的超参数的变化不太敏感,因此可以有效地应用于现实世界的实践。5结论本文提出了一种新的基于负确定性信息(NDI)的方法,即NDI-WSOD。我们发现否定实例通常包含有价值的NDI,然后设计了一个收集阶段来提取否定实例。利用这个NDI,我们提出了一个开发阶段,包括一个负对比 学 习 ( NCL ) 机 制 和 一 个 负 引 导 的 实 例 选 择(NGIS)策略,分别处理部分支配和丢失的实例。在VOC 2007、VOC 2012和MS COCO上进行的实验结果证明了我们提出的NDI-WSOD的有效性。CMU+LniceCMU+LniceCMU+LniceCMU+Lnice137954.354.655.855.1基线52.968.5基线+NCL56.0(+3.1)70.4(+1.9)基线+NGIS54.7(+1.8)69.6(+1.1)+v:mala2277获取更多论文引用[Arbe la'ezetal. 2014]PabloArbela' ez , JordiPont-Tuset ,Jonathan T Barron , Ferran Marques , and JitendraMalik.多尺度组合分组。在IEEE计算机视觉和模式识别会议(CVPR)的会议中,第328-335页[Bilen and Vedaldi , 2016] Hakan Bilen and AndreaVedaldi.弱监督深度检测网络在IEEE计算机视觉和模式识别会议(CVPR)的论文集中,第2846-2854页,2016年[Everingham et al. ,2010] Mark Everingham,Luc VanGool , Christopher KI Williams , John Winn , andAndrew Zisser-man. The pascal visual object classes(pascal)challenge.国际计算机视觉杂志(IJCV),88(2):303[Girshick,2015] Ross.女孩快速R-CNN。在IEEE国际计算机视觉会议(ICCV)的会议记录中,第1440-1448页[Grill et al. , 2020] Jean-Bastien Grill, Florian Strub ,Flo-rentAltche' , CorentinTallec , PierreHRichemond ,ElenaBuchatskaya , Carl Doersch , Bernardo AvilaPires,Zhao- han Daniel Guo,Mohammad GheshlaghiAzar,et al.引导你自己的潜意识:一种新的自我监督学习方法。在神经信息处理系统(NeurIPS)的进展,2020年。[He et al. 何开明、范浩奇、吴宇欣、谢赛宁和RossGirshick。用于无监督视觉表征学习的动量对比。在IEEE计算机视觉和模式识别会议(CVPR)的会议记录中,第9729-9738页[Huang et al. 黄泽义,邹阳,Vijayakumar Bhagavatula和黄东。用于弱监督对象检测的综合注意力自升华。神经信息处理系统进展(NeurIPS),2020年。[Khosla et al. Prannay Khosla , Piotr Teterwak , ChenWang,Aaron Sarna,Yonglong Tian,Phillip Isola,Aaron Maschinot,Ce Liu,and Dilip Krishnan.有监督的对比学习。在神经信息处理系统(NeurIPS)的进展,2020年。[Kim et al. Youngdong Kim,Junho Yim,Juseung Yun,and Junmo Kim.Nlnl:噪声标签的负学习在IEEE计算机视觉国际会议(ICCV)的会议记录中,第101-110页[Lin et al. Tsung-Yi Lin , Michael Maire , Serge Be-longie,James Hays,Pietro Perona,Deva Ramanan,Piotr Doll a'r,andCL a wrenceZitnick. Microsoftcoco:上 下 文 中 的 通 用 对 象 . 在 欧 洲 计 算 机 视 觉 会 议(ECCV),第740-755页[Lin et al. Chenhao Lin,Siwen Wang,Dongqi Xu,YuLu,and Wayne Zhang.面向弱监督对象检测的对象实例挖掘。在AAAI人工智能会议(AAAI)的会议记录中,第11482-11489页[Redmon et al. Joseph Redmon ,Santosh Divvala,RossGirshick,and Ali Farhadi.您只需查看一次:统一、实时的物体检测。在IEEE计算机视觉和模式识别会议(CVPR)中,第779-788页[Ren et al. 任少卿,何开明,Ross Gir-shick和孙健。更快的r-cnn:用区域建议网络实现实时神经信息处理系统进展(NeurIPS),第91-99页,2015年[Ren et al. Zhongzheng Ren , Zhiding Yu , XiaodongYang , Ming-Yu Liu , Yong Jae Lee , Alexander GSchwing,and Jan Kautz.实例感知、上下文聚焦和内存高效的弱监督对象检测。在IEEE计算机视觉和模式识别会议(CVPR)的会议记录中,第10598-10607页,2020年。[Tang et al. Peng Tang,Xinggang Wang,Xiang Bai,andWenyu Liu.具有在线实例分类器细化的多实例检测网络在IEEE计算机视觉和模式识别会议论文集,第2843-2851页[Tang et al. ,2018] Peng Tang,Xinggang Wang,SongBai,Wei Shen,Xiang Bai,Wenyu Liu,and AlanYuille. Pcl : Proposal Cluster Learning for WeaklySupervisedObjectDetection.IEEEtransactionsonpattern analysis and machine intelligence(TPAMI),42(1):176[Uijlings et al. Jasper RR Uijlings , Koen EA Van DeSande,Theo Gevers,and Arnold WM Smeulders.选择性搜索对象识别。International Journal of ComputerVision(IJCV),104(2):154[Wan et al. ,2019] Fang Wan,Chang Liu,Wei Ke,Xi-angyang Ji,XiaoJiao,and Qixiang Ye.C-mil:用于弱监督对象检测的连续多实例学习在IEEE计算机视觉和模式识别会议(CVPR)的会议记录中,第2199-2208页[Yang et al. 杨克,李东升,窦勇。面向精确的端到端弱监督对象检测网络。在IEEE计算机视觉和模式识别会议(CVPR)的会议记录中,第8372-8381页[Yin et al. Yufei Yin,Jiajun Deng,Wengang Zhou,andHouqiang Li.基于类特征库的弱监督目标检测实例挖掘。在AAAI人工智能会议(AAAI)的Proceedings中,第3190-3198页[Zeng et al. Zhaoyang Zeng , Bei Liu , Jianlong Fu ,Hongyang Chao,and Lei Zhang.Wsod 2:学习自下而上和自上而下的对象蒸馏,用于弱监督对象检测。在IEEE国际计算机视觉会议(ICCV)的会议记录中,第8292-8300页
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 构建基于Django和Stripe的SaaS应用教程
- Symfony2框架打造的RESTful问答系统icare-server
- 蓝桥杯Python试题解析与答案题库
- Go语言实现NWA到WAV文件格式转换工具
- 基于Django的医患管理系统应用
- Jenkins工作流插件开发指南:支持Workflow Python模块
- Java红酒网站项目源码解析与系统开源介绍
- Underworld Exporter资产定义文件详解
- Java版Crash Bandicoot资源库:逆向工程与源码分享
- Spring Boot Starter 自动IP计数功能实现指南
- 我的世界牛顿物理学模组深入解析
- STM32单片机工程创建详解与模板应用
- GDG堪萨斯城代码实验室:离子与火力基地示例应用
- Android Capstone项目:实现Potlatch服务器与OAuth2.0认证
- Cbit类:简化计算封装与异步任务处理
- Java8兼容的FullContact API Java客户端库介绍
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功