深度解析：ATSS机制与一阶段检测器

需积分: 5 137 浏览量更新于2024-08-05 收藏 2.52MB PPTX 举报

"这篇文档深入解析了ATSS(Adaptive Training Sample Strategy)机制，这是深度学习算法在目标检测领域中的一个重要应用。文档首先介绍了两种基础的一阶段检测器——RetinaNet和FCOS，并分析了它们的工作原理，接着重点讨论了ATSS如何改进这些方法。" 在目标检测领域，一阶段检测器如RetinaNet和FCOS因其简洁的架构而受到关注。RetinaNet是基于Anchor机制的检测器，它结合了Feature Pyramid Network (FPN)和专门设计的Focal Loss来处理类别不平衡问题。RetinaNet的网络结构包括Resnet50作为主干网络，FPN用于提取多尺度特征，RetinaHead则包含分类子网络和回归子网络。分类子网络为每个空间位置的多个Anchor预测类别概率，回归子网络则负责预测边界框。RetinaNet的Anchor box设计包括不同尺度和宽高比，正负样本是根据与Ground Truth (GT)的Intersection over Union (IoU)来定义的。 FCOS则是一种无Anchor的目标检测器，它摒弃了Anchor机制，直接在Feature Map上进行分类和定位预测。FCOS的分类子网络、回归子网络和新增的Center-ness子网络共同作用，其中Center-ness用于衡量预测框的中心性，以抑制那些远离目标中心的低质量检测框。在训练时，FCOS每个位置仅输出一个4D向量表示边界框坐标，并通过一个额外的层预测Center-ness分数。 ATSS机制正是对这两种方法的改进，它适应性地选择训练样本，旨在优化训练过程中的样本选择策略。ATSS动态地调整 Anchor 的大小，以更好地匹配Ground Truth，同时减少了人为设定的Anchor参数，提高了检测精度和效率。这种策略在保留一阶段检测器的简洁性的同时，进一步提升了模型的性能。这篇文档深入剖析了深度学习中目标检测的核心算法，特别是ATSS机制如何改进传统的Anchor-based方法，如RetinaNet，以及Anchor-free方法，如FCOS。通过对这些技术的了解，读者能够更好地理解现代目标检测系统的设计思路和优化策略。

RetinaNet



分类子网络

•

在每个空间位置为 A 个 anchor 预测 K 个类别的概率

•

小的 FCN 网络，参数在金字塔所有 layer 间共享

•

对于输入 C 通道的 feature map ：

4 个（ C 通道的 3x3Conv + ReLU ） + K*A 通道的 1x1Conv



回归子网络

•

对于输入 C 通道的 feature map

4 个（ C 通道的 3x3Conv + ReLU ） + 4*A 通道的 1x1Conv

•

使用 class-agnosc bbox regressor

剩余12页未读，继续阅读

AI松子666

粉丝: 1941
资源: 4

深度解析：ATSS机制与一阶段检测器

IXIA RFC2544+ATSS Throughput测试配置

单片机-ATSS双L驱动控制器DXP资料.zip

firefire_用ATSS训练自己的目标检测模型!!_

另一种实现yolox旋转目标检测，支持simOTA、ATSS等。.zip

torch_Retina_face_bifpn_bce_try_0124_atss.rar

Bridging_the_Gap_Between_Anchor-based_and_Anchor-f_ATSS.zip

基于YOLOX的旋转目标检测源码(支持simATM、ATSS、TOPK等正负样本匹配).zip

ATSS:通过自适应培训样本选择弥合基于锚和无锚检测之间的差距，CVPR，口头，2020年

ATSS目标检测模型训练教程与PDF下载

NanoDet算法详解：轻量级检测与ATSS采样策略

最新资源