基于锚点的目标检测方法中的锚点增强方法AADI及其在COCO数据集上的性能改进

106 浏览量更新于2024-02-04 收藏 1.03MB PDF 举报

目标检测

实验结果

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

+v：mala2277获取更多论文通过检测器本身来万晓培清华大学wxp18@mails.tsinghua.edu.cn陈圣杰清华大学chen-sj17@mails.tsinghua.edu.cn杨玉久清华大学yang.sz.tsinghua.edu.cn郭振华阿里巴巴集团cszguo@gmail.com陶方波阿里巴巴集团fangbo.gmail.com摘要在基于锚点的目标检测方法中，锚点的尺度和长宽比难以确定。现有的目标检测器要么根据数据集中目标的形状和尺度来确定锚点参数，要么利用无锚点方法来本文提出了一种无梯度的锚点增强方法AADI，即由检测器自己对锚点进行增强AADI不是一种无锚方法，但它将锚的尺度和长宽比从连续空间转换到离散空间，大大简化了锚的设计问题此外，AADI没有添加任何参数或超参数，这有利于未来的研究和下游任务。在COCO数据集上的大量实验表明，AADI对于两阶段和单阶段方法都具有明显的优势，具体来说，AADI在Faster R-CNN上实现了至少2.1个AP的改进，1.6使用ResNet-50模型对RetinaNet进行AP改进。我们希望这种简单而经济的方法可以广泛应用于目标检测。1介绍目标检测是计算机视觉中的一个基本而关键的问题，随着深度学习的发展，当前的对象检测器通常基于卷积神经网络，如 FCOS Tian et al. （ 2019 ）， RepPoints Yanget al.（2019）;Chenet al. （2020），FasterRen etal. （2016）/CascadeCaiandVasconcelos（2018）RCNN，DETR Carion et al.（2020）and Sparse R-CNN Sun et al.（2020）等，根据它们生成检测结果的方式，它们大致可以分为无锚点或基于锚点的方法。基于锚点的方法首先放置大量具有不同尺度和长宽比的锚点，然后细化这些锚点以生成建议或检测结果，而无锚点方法直接从特征图生成建议或检测结果。无锚方法曾经被广泛认为是未来目标检测器的标准范例然而，ATSS Zhanget al. （2020）已经证明，无锚方法并不比基于锚的方法更有效，并且在相同的技巧和适当的判断阳性和阴性样本的基础上，基于锚的ATSS的性能可以优于无锚FCOS。PAAKim and Lee（2020）在ATSS的基础上，提出了一种利用高斯混合模型判断正负样本的方法，并取得了较大的改进，进一步证明了上述结论。这两种方法都对锚的尺度和长宽比表现出很强的鲁棒性，但这也意味着很难通过操纵手工设计的锚来提高它们的性能，因为将更多具有不同尺度和长宽比的锚放置在这个工作是万小培在蚂蚁集团预印本的时候做的正在审查。arXiv：2105.14086v1 [cs.CV] 2021年5月+v：mala2277获取更多论文2(a) 主播（b）加强锚。（c）区域方案网络与阿拉伯农业发展和工业协会的提案。图1：RPN的AADI可视化（a）标准RPN的手工设计锚（b）AADI加固的锚。(c)AADI-RPN提出的建议每个位置可以增加正样本的数量和质量，同时也增加了硬样本的数量。因此，如何在锚杆数量固定的情况下，提高锚杆的质量成为一个重要的问题。更好的锚通常可以使分类和框回归任务更容易，因为更多的锚将被匹配为阳性样本，并且它们的质量可以更高。这样一来，首先获得更好的锚点，然后用它们来匹配地面实况是目前的主流做法。AttratioNetGidaris和Komodakis（2016）， GA-RPN和Cascade RPN都是基于这一思想的方法。 AttratioNet 多次迭代其 ARN 以增强手工设计的锚，并使用 RoIPoolingGirshick（2015）来提取每个提案的特征。引导锚定RPN（GA-RPNWang et al.（2019））首先估计锚点在每个位置的位置和形状，然后细化估计的锚点以生成建议。GA-RPN可以明显改善Faster R-CNN和RetinaNet Lin等人的性能。（2017），并在此基础上，Cascade RPNVu et al.（2019）提出了一种先对手工设计的锚点进行细化，然后对细化后的锚点进行特征对齐的方法，这使其成为当前最先进的方法。AttratioNet，GA-RPN和Cascade RPN都是基于梯度的锚点增强方法，由于特征对齐时需要大量的内存访问，其训练和推理速度非常慢。本文提出了一种无梯度的锚点增强方法AADI，即由检测器自己对锚点进行增强 AADI可以应用于两阶段和单阶段方法，图1显示了RPN Ren等人的AADI示例。（2016年）。在训练过程中，AADI首先使用RPN来增强手工设计的锚点，以提高其质量，然后使用增强的锚点和地面实况来训练RPN的参数。我们把这两个过程分别称为增广过程和精化过程。在增强过程中，RPN使用扩张卷积Yu和Koltun（2015）来增强每个手动设计的锚钉，并采用RoIAlign He等人。（2017）提取增强锚点的特征，并使用全连接操作在细化过程中细化这些锚点。为了使RPN的参数在这两个过程中得到重用，我们提出了一种根据卷积运算的膨胀和核来假设内核的高度和宽度分别为m和n，并且膨胀为d，如等式（1）所示。1和等式如图2所示，如果卷积层的内核和膨胀被确定，则锚的尺度和纵横比也可以被确定。通过这种方式，AADI将锚的尺度和长宽比从连续空间转换为离散空间，从而大大简化了锚的指定问题。scale=mnd（1）n纵横比=M（二）增强过程不需要计算梯度，这使得AADI的训练速度非常快。在推理过程中，AADI只将前2000个增强锚作为RPN的输入进行进一步的细化，这使得推理速度非常快。广泛的实验，+v：mala2277获取更多论文3MS COCO数据集表明，AADI可以有效地提高基于锚点的对象检测器的性能1.6 AP对RetinaNet的改进我们的主要贡献可归纳如下：• 我们提出了一种新颖而简单的方法AADI，它通过检测器本身来增加锚点，可以显着提高锚点的质量。它可以应用于所有基于锚的对象检测器，只有很少的额外计算成本。• AADI根据卷积层的核和膨胀来确定锚点的尺度和长宽比，并根据核的形状来确定长宽比，大大降低了锚点设计的难度。• 在MS COCO数据集上，没有任何花里胡哨的东西，AADI至少达到2.1 AP，1.6分别对Faster R-CNN和RetinaNet的AP改进2相关作品目前的目标检测方法大致可以分为两类，一类是基于锚点的方法，另一类是无锚点的方法。基于锚点的方法首先在特征图上放置大量手工设计的锚点，然后对这些锚点进行分类和箱回归。因此，更好的锚可以大大降低这两项任务的难度AttratioNet使用ARN多次迭代地优化手工设计的锚点，然而，ARN需要使用RoI Pooling来提取每个锚点的特征，并且它不是一个轻量级网络，这使得它的训练和推理速度非常慢。GA-RPN首先为每个位置预测一个合适的锚点，然后使用预测的锚点来训练RPN。Cascade RPN将两个RPN堆叠在一起以提高提案的质量，其第一个RPN用于改进手工设计的锚而不进行分类，第二个RPN与标准RPN起相同的作用GA-RPN和Cascade RPN通过提高主播质量，有效提高了提案质量。然而，它们都需要使用DCNDaiet al.（2017）来对齐特征和锚点，在此操作期间有大量的内存访问，导致训练和推理速度较慢。与无锚点方法相比，基于锚点的方法更直观，并且它们不需要确定哪个地面真值应该放置在金字塔特征的哪个级别上。然而，FCOS发现，确定锚点的尺度和长宽比并不是一个微不足道的问题，这两个参数对性能有很大的影响。因此，FCOS提出了一种无锚范式来生成最终结果。对于位于地面实况中心区域的每个位置，它直接预测从位置到地面实况角的距离。RepPoints也是一个无锚点的方法。它不再直接预测边界框，而是为每个地面实况预测一组代表点，然后将它们分组到边界框。DETR使用Transformer虽然无锚点方法的超参数调整更简单，但ATSS和PAA表明，采用合适的锚点分配策略的基于锚点的方法的性能可以显著优于无锚点方法。然而，ATSS和PAA的锚点都是预定义的，尽管ATSS和PAA对锚点的尺度和长宽比都非常鲁棒，但它们很难进一步提高性能。因此，如何自适应地提高主播的素质是一个悬而未决的问题。3方法3.1AADI高质量的锚点对于所有基于锚点的目标检测器都是至关重要的，因此，如何自适应地获得更好的锚点是一个重要因素。与以前的基于梯度的方法不同，AADI只是使用检测器本身来增强手工设计的锚点，而没有梯度。AADI主要用于两阶段方法，也可用于单阶段方法。对于两阶段方法，我们使用RPN作为增强器，模型如图2所示，其PyTorch类伪代码如算法1所示。与AttratioNet相比，AADI在锚钉增强期间不需要计算梯度。并与IBBR（迭代边界BoxR回归）进行了比较，+v：mala2277获取更多论文43∗图2：RPN的AADI管道。RPNc和RPNf的参数是共享的，并且RPNc不参与训练。算法1类似PyTorch风格的AADI伪代码#rpn：标准RPN，包含3个卷积层：conv，cls_logits和anchor_deltas#features：由主干提取的特征。#锚：手持-设计的锚，其比例和长宽比遵循等式(1).进口手电筒，Torchvision.ops.roi_align 作为 roi_align，torch.nn.functional作为Fdefobtain_proposals（rpn，features，anchors）#使用torch.no_grad（）的AADI管道：# 获得的加强锚cls_logits，螺旋锚 = rpn（特征，锚点）# nms_and_sample_anchors：通过NMS过滤冗余锚点，并对2000个锚点进行采样以进一步细化aug_anchors =filter_and_sample_anchors（cls_logits，aug_anchors）#RPNfaug_features = roi_align（features，aug_anchors）aug_features =F.relu_（F.linear（aug_features，rpn.conv.weight.flatten（1），rpn.conv.bias））cls_logits = F.linear（aug_features，rpn.cls_logits.weight.flatten（1），rpn.cls_logits.bias）anchor_deltas = F.linear（aug_features， rpn.anchor_deltas.weight.flatten（1）， rpn.anchor_deltas.bias）#将anchor_deltas添加到aug_anchorsproposals = aug_anchors + anchor_deltas返回cls_logits， proposalsIoU-NetJianget al. （2018），它们具有类似的推理管道，但是，关键的区别在于AADI在训练和推理期间都工作，而IBBR只工作于推理。在图2中，RPNc和RPNf具有相同的参数，但它们以不同的方式实现。RPNc与标准RPN相同，它使用卷积来获得增强的锚点，而RPNf以完全连接的方式实现。此外，RPNf采用RoIAlign来提取每个增强锚点的特征。由于RPNc在训练过程中不需要计算梯度，因此，对于每个手动设计的锚点，两个RPN获得的特征应该相同。对于RPNc，每个锚点的特征由卷积层的内核和膨胀确定，而对于RPNf，特征由RoI Align确定。所以，有两个条件要满足。首先，RoI Align的输出大小需要与卷积层的内核大小相同其次，每个锚钉的扩张和比例必须仔细设计，以对齐RoI Align，这是很难满足的。幸运的是，我们发现，如果手工设计的锚的比例和纵横比满足方程。1和等式2，则满足第二个条件。在图3中，我们可视化了不同膨胀下3x3卷积层采样的锚点及其特征，很容易发现3x3卷积层采样的特征与3x3 RoI Align提取的特征相同以这种方式，锚的纵横比也由内核的形状决定例如，对于3x3卷积层，如果其膨胀设置为2，则锚点的比例为32 = 6，纵横比为3=1。因此将锚的指定空间从连续空间转换为离散空间，极大地简化了锚点指定的问题。+v：mala2277获取更多论文5LL(a) dilation=1.（b）扩张=2。（c）扩张=3。图3：不同膨胀下的卷积，卷积层的内核固定为3*3。3.2培训由于AADI仅在增强的锚上训练，因此AADI因此，在训练过程中，我们首先为每个地面真值选择一个具有最大IoU的手工设计的锚点，然后将它们附加到增强锚点，这可以指导AADI增强手工设计的锚点。正增广锚点的数量非常大，如果直接使用它们，内存将耗尽。此外，我们发现一些增强锚的重叠很大。因此，我们使用NMS根据具有地面真实值的IoU过滤掉冗余锚点。与RPN类似，AADI可以使用多任务丢失以端到端的方式进行训练，如下所示：scale=λLreg+Lcls（3）其中reg和cls分别是分类损失和箱回归损失。这两个损失项由λ平衡。在实现中，二进制交叉熵损失和平滑L1损失Girshick（2015）分别用作分类损失和箱回归损失，λ是经验设置的。3.3推理在推理过程中，获得增广锚点的方法与标准RPN获得建议的方法相同。因此，AADI可以被视为RPN本身增加提案的一个计划在这里，AADI仅采用前2000个增强锚点进行进一步优化，而Cascade RPN需要增强所有回归锚点。4实验4.1数据集和评估我们的实验是在具有挑战性的Microsoft COCO 2017上实现的。（2014）dataset.它包括用于训练的118 k图像，train-2017和用于验证的5 k图像，val-2017。我们在detectron 2之后的train-2017中删除了1021张没有可用注释的图像在test-dev中还有20 k张没有注释的图像用于测试。除非特别指出，我们的模型的超参数如下detectron 2吴等人。此外，RPN的3x3卷积层的膨胀设置为3，损失平衡项λ=5，平滑L1损失的β设置为0.5。我们在train-2017上训练所有模型，并在val-2017上报告消融研究，在test-dev上报告最终结果。本文使用平均召回率（AR）来衡量提案的质量，它是不同IoU阈值下召回率的平均值，ARx表示IoU阈值x%下的召回率，ARs，ARm和ARl分别表示小，中，大对象的AR检测+v：mala2277获取更多论文6速度方法巴科内AR100AR1000ARsARmARl列车（ms）测试（FPS）AttratioNetVGG-1653.366.231.562.277.7--ZIP成立53.967.031.963.078.5--C-RPN公司简介54.063.035.662.778.5--RPN公司简介45.758.031.452.761.1186.031.3PAA公司简介49.762.731.459.468.3342.631.4GA-RPN公司简介59.168.540.768.278.4448.114.7级联RPN公司简介61.171.742.169.382.8436.415.1AADI-RPN公司简介55.667.636.164.377.6170.225.6表1：COCOval-2017的区域提案结果。结果经受标准COCO风格的平均精度（AP）度量，其包括AP（AP在所有IoU阈值上的平均值）、AP50、AP75、APs、APm和APl，其中AP50和AP75分别是针对50%和75%的IoU阈值的AP，并且APs、APm和APl分别是针对小、中和大对象的AP4.2实现细节所有的实验都是基于detectron2。我们的代码部署在具有8个Tesla V100-SXM 2 - 16 GB GPU和Intel Xeon Platinum 8163 CPU的机器上。软件环境主要包括Ubuntu 18.04 LTS OS、CUDA10.1、GCC 7.3、PyTorch Paszke等。（2017）1.6.0和Python3.8.5.其他设置遵循detectron2，除非特别注明。作为一种常见的做法，Girshick et al.（2014），所有的网络骨干都是在ImageNet1k分类集上进行预训练的。（2009），他们的预训练模型是公开的。Wuetal. （2019）训练时间表，我们的模型需要大约4.2小时才能收敛，混合精度Micikevicius等人大约需要2.9小时。（2017年）。4.3结果区域提案绩效。我们首先将AADI应用于Faster R-CNN的RPN（AADI-RPN），以验证其在区域建议上的性能，并在COCOtrain-2017上以1x训练时间表训练模型。由于很难再现AttratioNet的性能，ZIPLi等人。（2019）和C-RPN Fan and Ling（2019），我们仅将召回率与已发表的结果进行比较。对于其他模型，在同一台机器上测试它们的性能，训练时间表示每批的平均时间成本，而测试时间表示COCOval-2017上的平均推理速度。所有区域提案结果见表1。从表中可以看出，在所有设置下，AADI-RPN在AR方面的表现都大大优于标准RPN。此外，尽管AADI-RPN的召回率低于当前最先进的Cascade RPN，但其推理速度快约70%。对于训练时间，AADI-RPN实现了最快的训练速度，甚至比RPN更快。这主要是因为只有一小部分增强锚点参与训练过程，并且增强锚点经过NMS过滤，使得内存访问量相对较低，进一步加快了训练过程。目标检测性能。更好的RPN通常会带来更好的检测性能，因此我们将Faster R-CNN的RPN替换为AADI-RPN来测试其检测性能，我们将所提出的模型称为AADI-Faster R-CNN。在GA-RPN和Cascade RPN之后，R-CNN中的IoU具体地，IoU阈值被设置为0.6，并且提议的数量被设置为1000。请注意，这里PAA是一个两阶段方法，其锚点分配策略用于其RPN中。我们主要测试FasterR-CNN在不同骨干和训练时间表下的性能，所有检测结果如表2所示。有趣的是，虽然AADI-RPN的AR低于GA-RPN和Cascade RPN，但其检测性能优于它们，特别是对于小目标。这主要是因为AADI在锚点增强过程中不添加任何参数和超参数，也不计算梯度，所以训练过程不会受到太大影响。此外，AADI更快+v：mala2277获取更多论文7方法骨干附表APAP50AP75APsAPmAPlPAA公司简介1x39.360.042.622.743.251.9GA-RPN公司简介1x39.459.442.821.641.950.4级联RPN公司简介1x40.658.944.522.042.852.6Faster R-CNN公司简介1x38.359.541.422.340.747.9Faster R-CNN公司简介3x40.461.443.923.642.850.3Faster R-CNNDCN 50-FPN3x42.263.346.024.844.453.2Faster R-CNNR101-FPN3x42.463.146.125.045.053.4AADI-更快的R-CNN公司简介1x41.059.845.223.944.051.2AADI-更快的R-CNN公司简介3x42.961.747.024.945.853.7AADI-更快的R-CNNDCN 50-FPN3x44.363.448.526.146.756.1AADI-更快的R-CNNR101-FPN3x44.663.648.926.247.655.8表2：COCOtest-dev上的两阶段检测结果，其中扩张锚钉引导AR100AR1000ARsARmARl254.864.739.063.170.62C56.366.739.564.973.4353.764.035.462.173.93C 55.667.636.164.377.6452.260.530.961.376.64C54.465.533.063.778.9RPN 45.758.031.452.761.1表3：不同设置下AADI-RPN的区域提案结果R-CNN在Faster R-CNN上带来了至少2.1个AP的改进，具有不同的骨干和训练时间表。同时，我们可以发现AADI-Faster R-CNN因此，AADI-Faster R-CNN的主要优点是提高提案的质量，从而提高检测性能。5消融研究我们在COCOtrain-2017上进行消融研究，并在COCOval-2017上报告结果数据集。所有型号5.1智能分析从Eq可以看出。1和等式2，锚的尺度和纵横比由卷积层的内核和膨胀对于RPN，由于内核固定为3*3，因此我们只能通过调整膨胀来改变锚的尺度在这里，我们分别测试了RPN在膨胀为2、3和4时的区域建议此外，还测试了所提出的策略的效果，即首先选择一小组手工设计的锚，然后将它们附加到增强锚来引导AADI（锚引导）。所有结果示于表3中。从表3中，我们可以得出结论，更大的膨胀，小对象的性能更差，而大对象的这是因为锚定件的尺度将随着扩张变大而变大因此，大锚对大物体有利，但对小物体有害。此外，锚点引导的策略可以一致地提高不同膨胀的AADI-RPN的性能与标准RPN相比，AADI-RPN在不同的设置下都有很大的优势，表明AADI是一种有效的方法。此外，我们发现，有没有太大的差异，在不同的扩张性能的AADI-RPN因此，我们测试检测性能以确定哪种膨胀是最佳选择，+v：mala2277获取更多论文8扩张附表APAP50AP75APsAPmAPl21x40.359.344.324.243.352.231x40.859.545.024.044.653.141x40.558.744.623.244.852.733x42.561.246.525.346.255.5Faster R-CNN1x37.958.841.122.441.149.1Faster R-CNN3x40.261.043.824.243.552.0表4：具有不同扩张的AADI-Faster R-CNN的检测性能(a) AADI-RPN。（b）AADI-RetinaNet图4：AADI-RPN和AADI-RetinaNet的模型。(a)AADI-RPN。(b)AADI-RetinaNet的箱式子网模型与其类子网具有相似的结构。所有测试均采用锚点引导策略。所有检测结果见表4。我们根据经验发现，当膨胀设置为3时，这意味着锚的尺度在9的情况下，AADI-Faster R-CNN在除AP之外的所有指标中均实现了最佳检测性能。此外，当我们将训练时间表从1x扩展到3x时，AADI-Faster R-CNN始终优于Faster R-CNN 2.3 AP点。因此，AADI不仅是一种加速模型收敛的方法，而且可以有效提高检测模型的上限5.2AADI-视网膜网AADI首先增强手工设计的锚点，然后使用增强的锚点来训练模型。通过这种方式，AADI可以自然地部署在基于锚的单级目标检测器中。由于时间和资源有限，我们只在RetinaNet上应用AADI（AADI-RetinaNet）。由于RetinaNet使用两个多层卷积网络分别提取分类和回归任务的特征，并且所有卷积层的内核都是3x3，因此我们只能使用盒子子网的最后一层来提取增强锚的特征。AADI-RPN和AADI-ReitinaNet之间的差异如图5所示。AADI-RetinaNet的训练过程类似于AADI-RPN，但是，在推理过程中，我们只选择前2000个没有NMS的增强锚点进行进一步的改进。这里，类子网和后处理的IoU阈值都设置为0.6。此外，使用GroupNormalizationWu and He（2018）使训练过程更加平滑，并且还测试了推理速度作为AADI-RPN。所有结果示于表5中。从表5中，我们可以得出结论，当dilation设置为2时，AADI-RetinaNet实现了最佳性能，这意味着锚的比例为6。此外，当我们将训练时间表从1x扩展到3x时，在没有任何额外功能的情况下，AADI-RetinaNet始终优于RetinaNet至少1.6 AP。通过与RepPoints、FCOS、ATSS和PAA的比较，我们发现AADI-RetinaNet在AP上的表现优于RepPoints、FCOS和ATSS，尤其是在AP75上。AADI-RetinaNet的检测性能低于PAA，然而，PAA涉及锚分配，而AADI是锚增强方法。它们不是竞争性的，而是互补性的。换句话说，AADI-RetinaNet和PAA可以相互结合，以进一步提高检测性能。+v：mala2277获取更多论文9扩张附表APAP50AP75APsAPmAPl推理速度（FPS）11x37.356.440.222.039.946.82 1x 39.8 57.5 43.5 22.1 43.550.623.0表5：具有不同扩张的AADI-RetinaNet的检测性能很明显，AADI-RetinaNet比表5中的其他模型具有更高的FLOPS，然而，如表5所示，我们发现AADI-RetinaNet运行速度比它们都快我们猜测原因是AADI-RetinaNet的检测结果比其他模型的结果更好，这使得它的后处理速度更快。6结论在本文中，我们提出了一种无梯度锚增强方法AADI。它不添加任何参数和超参数。我们在RPN，Faster R-CNN和RetinaNet上进行了实验，以验证其性能。对于RPN，与其他方法相比，我们的AADI-RPN具有最快的训练速度，并且它不会显著影响推理速度。此外，我们的AADI- Faster R-CNN在Faster R-CNN上实现了至少2.1 AP的改进，我们的AADI-RetinaNet在RetinaNet上实现了 1.6 AP的改进在我们未来的工作中，我们将尝试将AADI和其他基于锚点的方法结合起来，以进一步提高检测性能。引用蔡兆伟和努诺·瓦斯康塞洛斯。2018年Cascade r-cnn：深入研究高质量的对象检测。在IEEE计算机视觉和模式识别会议论文集中，第6154- 61596162.尼古拉斯·卡里昂、弗朗西斯科·马萨、加布里埃尔·辛纳伊夫、尼古拉斯·乌索尼尔、亚历山大·基里洛夫和谢尔盖·扎戈鲁伊科。2020年。使用变压器进行端到端物体检测arXiv预印本arXiv：2005.12872。Yihong Chen，Zheng Zhang，Yue Cao，Liwei Wang，Stephen Lin，and Han Hu.2020年。Reppoints v2：验证符合对象检测的回归。在NeurIPS中。戴继丰、齐浩之、宇文雄、李毅、张国栋、韩虎、魏一晨。2017.可变形卷积网络。IEEE计算机视觉国际会议论文集，第764J. 邓，W。东河，巴西-地索赫尔湖，澳-地李，李凯，李飞飞。2009年Imagenet：一个大规模的分层图像数据库。2009年IEEE计算机视觉与模式识别会议，第248-255页。Heng Fan和Haibin Ling。2019.用于实时视觉跟踪的连体级联区域建议网络。IEEE/CVF计算机视觉和模式识别会议论文集，第7952斯派罗·吉达里斯和尼科斯·科莫达基斯2016.参与细化重复：通过输入输出本地化生成活动框提案。arXiv预印本arXiv：1606.04446。罗斯·格希克2015.快速R-CNN。IEEE计算机视觉国际会议论文集，第144031x38.354.641.720.043.151.123x41.459.345.224.844.954.0RetinaNet1x38.258.441.124.342.248.522.2RetinaNet3x39.659.342.224.943.350.722.2RepPoints1x38.158.740.822.041.950.117.5FCOS1x38.657.441.422.342.549.822.2ATSs1x39.457.642.823.642.950.322.7PAA1x40.458.443.922.944.354.022.5+v：mala2277获取更多论文10Ross Girshick，Jeff Donahue，Trevor Darrell，and Jitendra Malik.2014年。丰富的特征层次结构，用于精确的对象检测和语义分割。IEEE计算机视觉和模式识别会议论文集，第580Kaiming He，Georgia Gkioxari，Piotr Dollár，and Ross Girshick. 2017.面具R-CNN。IEEE计算机视觉国际会议论文集，第2961姜博瑞，罗睿轩，毛嘉源，肖特特，姜语宁。2018.获取定位置信度以实现准确的目标检测。在欧洲计算机视觉会议（ECCV）的会议记录中，第784Kang Kim和Hee Seok Lee 2020.用于目标检测的具有iou预测的概率锚点分配。在ECCV。Hongyang Li，Yu Liu，Wanli Ouyang，and Xiaogang Wang. 2019.放大和缩小网络，并进行区域建议和对象检测的地图注意力决策International Journal of Computer Vision，127（3）：225Tsung-Yi Lin，Priya Goyal，Ross Girshick，Kaiming He，and Piotr Dollár.2017年。用于密集目标检测的焦点损失IEEE计算机视觉国际会议论文集，第2980-2988页Tsung-Yi Lin ， Michael Maire ， Serge Belongie ， James Hays ， Pietro Perona ， DevaRamanan，Piotr Dollár，and C Lawrence Zitnick.2014年。Microsoft coco：上下文中的常见对象欧洲计算机视觉会议，第740-755页斯普林格。Paulius Micikevicius，Sharan Narang，Jonah Alben，Gregory Diamos，Erich Elsen，DavidGarcia，Boris Ginsburg，Michael Houston，Oleksii Kuchaiev，Ganesh Venkatesh，et al.2017.混合精确训练。arXiv预印本arXiv：1710.03740。Adam Paszke 、 Sam Gross 、 Soumith Chintala 、 Gregory Chanan 、 Edward Yang 、 ZacharyDeVito、Zeming Lin、Alban Desmaison、Luca Antiga和Adam Lerer。2017年。pytorch中的自动微分任少卿，何开明，Ross Girshick，孙健。2016.更快的r-cnn：用区域建议网络实现实时目标检测IEEE transactions on pattern analysis and machine intelligence，39（6）：1137孙培泽，张如锋，蒋毅，孔涛，徐晨峰，詹伟，Masayoshi Tomizuka，李磊，袁泽桓，王长虎，等。2020。Sparse r-cnn：端到端的目标检测，可学习的建议。arXiv预印本arXiv：2011.12450。智天、神春华、陈昊、童鹤。2019. Fcos：完全卷积的一级目标检测。IEEE计算机视觉国际会议论文集，第9627-9636页Thang Vu，Hyunjun Jang，Trung X Pham，and Chang Yoo. 2019. Cascade rpn：研究具有自适应卷积的高质量区域建议网络。神经信息处理系统的进展，第1432Jiaqi Wang，Kai Chen，Shuo Yang，Chen Change Loy，and Dahua Lin. 2019. 通过引导锚定的区域建议。在IEEE计算机视觉和模式识别会议论文集，第2965吴宇新和何开明。2018年组正常化。欧洲计算机视觉会议（ECCV）论文集，第3Yuxin Wu，Alexander Kirillov，Francisco Massa，Wan-Yen Lo，and Ross Girshick.2019年。探测器2。https://github.com/facebookresearch/detectron2上下载。Ze Yang，Shaohui Liu，Han Hu，Liwei Wang，and Stephen Lin. 2019. Reppoints：用于对象检测的点集表示。IEEEInternational Conference on Computer Vision（ICCV）+v：mala2277获取更多论文11Fisher Yu和Vladlen Koltun。2015年。通过扩张卷积的多尺度上下文聚合arXiv预印本arXiv：1511.07122。Shifeng Zhang，Cheng Chi，Yongqiang Yao，Zhen Lei，and Stan Z Li.2020年。通过自适应训练样本选择弥合基于锚点和无锚点检测之间的差距IEEE/CVF计算机视觉和模式识别会议论文集，第9759

下载后可阅读完整内容，剩余1页未读，立即下载