Instant-Teaching: 实时强化伪标签与协同校正提升半监督目标检测性能

需积分: 23 5 下载量 126 浏览量 更新于2024-08-04 收藏 1.43MB PPTX 举报
在现代计算机视觉领域,目标检测是一项关键任务,特别是在监督学习框架下,大量的手动标注数据对于模型的准确性和鲁棒性至关重要。然而,这种方法在实际应用中面临标注成本高、效率低的问题。为了解决这一挑战,半监督目标检测(Semi-supervised Object Detection, SSOD)作为一种新兴的研究方向,试图利用未标注数据来提升模型性能。 当前,最先进的SSOD方法如STAC,其核心问题是伪标签(pseudolabels)的生成和使用。STAC采用离线生成的伪标签,当模型的精度超过伪标签生成器时,继续使用不更新的伪标签会导致模型性能受限。这就引出了数据增强在半监督学习中的重要性,特别是针对SSOD设计更有效的策略。 Instant-Teaching论文提出了一种全新的端到端SSOD框架,它通过在线伪标注更新的方式解决了这些问题。首先,该框架采用弱-强数据增强策略,即在每次训练迭代中,使用当前模型生成的伪标注对未标记数据进行弱增强(如随机翻转),然后进一步对相同数据应用强增强,以此实时优化伪标注质量。这种方法允许模型随着训练的进行,逐步提高对未标记数据的理解和标注准确性。 此外,论文还关注了确认偏差(confirmation bias)问题,即伪标签中的错误可能会累积,影响模型的性能。为解决这个问题,Instant-Teaching提出了Co-rectify协同校正方案,通过同时训练两个模型,每个模型不仅学习数据,还负责检查和纠正对方的伪标签。这种机制有助于减少错误预测的累积,提高了模型的整体精度。 具体实验结果显示,Instant-Teaching在MS-COCO和PASCAL VOC等数据集上展现了显著的优势。例如,在使用2%的标记数据时,该方法在MS-COCO上的性能超越了当时的SOTA,提高了4.2 mAP。即便与完全监督模型相比,即使在MS-COCO上使用所有标注信息,该方法也能保持约1.0 mAP的领先。在PASCAL VOC上,仅用VOC07作为标记数据,VOC12作为未标记数据,就能实现5个以上mAP的显著提升。 Instant-Teaching通过创新的在线伪标注策略和协同校正机制,不仅解决了半监督目标检测中的关键问题,还展示了在有限标注数据情况下显著的性能提升,为未来的目标检测研究提供了有价值的参考和实践方法。