深度区域小块检测：DeepRegionlets框架

96 浏览量更新于2024-06-20 收藏 764KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

"本文提出了一种名为'深度区域小块(DeepRegionlets)'的新目标检测框架，该框架结合了深度神经网络与传统检测方法，旨在提高通用对象检测的准确性。DeepRegionlets由区域选择网络和深度regionlet学习模块组成，能够处理对象的变形和不同纵横比。在不依赖额外分割标签的情况下，该框架在PASCAL VOC和Microsoft COCO数据集上的表现优于现有先进算法，如RetinaNet和Mask R-CNN。" 在计算机视觉领域，目标检测是一项核心任务，其目标是识别并定位图像中的特定对象。传统的对象检测方法，如滑动窗口或候选区域生成，往往难以应对对象的形状变化、姿态和部分遮挡等问题。近年来，深度学习技术的引入极大地推动了目标检测的进步，例如R-CNN系列方法和YOLO等。本文提出的深度区域小块(DeepRegionlets)框架创新性地将regionlet概念与深度学习相结合。Regionlet是一种可以适应对象变形的局部特征表示，它允许检测器处理不同形状和大小的对象。在DeepRegionlets中，区域选择网络根据给定的检测边界框建议来决定何处选择区域以学习特征。这个网络能够生成非矩形区域，以更好地匹配对象的实际轮廓，从而提高了检测的准确性。深度regionlet学习模块专注于局部特征的选择和变换，以缓解局部变化的影响。这一模块采用全卷积网络进行特征提取，然后通过regionlet学习进一步优化特征表示，确保对各种对象部分和变形的鲁棒性。在训练过程中，DeepRegionlets框架是端到端的，这意味着它可以一次性地从原始图像到最终的检测结果进行学习，而不需要额外的后处理步骤。这种一体化的设计简化了模型的复杂性，同时也提高了整体的效率。在实验部分，作者在PASCAL VOC和Microsoft COCO这两个广泛使用的数据集上进行了详尽的评估。结果显示，提出的DeepRegionlets框架不仅在检测性能上超越了当前的顶级算法，如基于深度学习的RetinaNet和Mask R-CNN，而且在没有额外的分割标签辅助下，依然能取得优秀的检测结果。总结来说，"深度区域小块的目标检测方法"是一项重要的进展，它通过深度regionlet的引入，有效地解决了目标检测中的变形和多样性问题，为未来的目标检测研究提供了新的思路和方法。

资源详情

资源推荐

H. Xu，X.Lv、X。Wang，Z.Ren，N.Bodla和R.Chellappa

–

我们提出了对象检测基准数据集上的实证结果，证明了优于最先

进的性能。

相关工作

已经提出了许多用于对象检测的方法，包括传统方法[13，45，42]和基于

深度学习的方法[17，37，28，35，8，16，19，19，19，19，19，19，19，

19，19，19，19，19，19，19，19，19，19，19，19，19，19，19，19，

19，19，19，19，19，19，19，19，19，19，19，19，19

9、32、6、21、51、52、50、48、43、41]。传统的方法主要使用手工

制作的功能来训练使用滑动窗口范例的对象检测器最早的作品之一[42]

使用增强级联检测器进行人脸检测，这导致了其广泛采用。基于可变

形零件模型的检测（DPM）[12]提出了可变形零件模型的概念来处理

对象变形。由于深度学习技术的快速发展[24，20，40，5，49，34，

47，2，46]，基于深度学习的检测器已成为主要的对象检测器。基于

深度学习的检测器可以进一步分类为单阶段检测器和两阶段检测器，

基于检测器是否具有提议驱动机制。单级检测器[38，35，28，14，

25，26，48，50]在对象位置、尺度和纵横比上应用规则的密集采样窗

口。通过直接利用深度CNN网络中的多个层，单级检测器实现了高

速，但其准确性通常较低

与两级检测器相比。

两级检测器[17，37，8]涉及两个步骤。他们首先通过区域建议网

络（RPN）生成一在通过RPN过滤掉大部分负背景框之后，第二阶段

对检测边界框的建议进行分类，并执行边界框回归以预测对象类别及

其对应位置。两级检测器始终实现比单级检测器更高的精度，并且已

经提出了许多扩展[9，32，18，6，41，21，7]。我们的方法遵循两阶

段的检测器架构，利用RPN，而不需要密集的采样对象的位置，尺度

和纵横比。

我们的方法

在本节中，我们首先回顾了传统的基于区域的检测方法，然后介绍了

端到端可训练深度区域方法的总体设计。最后，我们详细讨论了所提

出的端到端的深度regionlet方法中的每个模块。

3.1

传统的基于区域的方法

regionlet

是以任意分辨率（即，窗口）与窗口（即，滑动窗口或检测

边界框）

成比例地定义的基本特征提取区域。

尺寸和纵横比）。

Wang

等人

[

45]第一次提出了

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度区域小块检测：DeepRegionlets框架

深度学习中的目标检测.zip

基于深度学习的目标检测

基于深度学习的目标检测程序

基于滑动窗口的行人检测

深度学习中overlap patch embeding

yolov5,不规则矩形

计算机视觉应用于行人检测方面有什么技术

用你自己的话说说图像分割的作用

opencv去马赛克恢复原图

具体详细介绍CNN的结构和作用

yolo中将mosaic数据增强改为mosaic9数据增强的好处

cagnet: content-aware guidance for salient object detection

mosaic实例分割数据增强

多无人机协同侦察任务航迹如何规划

介绍一下卷积神经网络

几种基于深度学习的目标检测算法

基于轻量级深度网络的目标识别方法

数据结构实验报告(集合)

MythwareStudentHacker-main.zip

《金智慧RFID高校固定资产管理平台解决方案》.doc

最新资源