a survey of deep learning-based object detection
时间: 2023-04-22 08:01:54 浏览: 165
Survey Transformer based Video-Language Pre-training.zip
深度学习基于目标检测的调查
目标检测是计算机视觉中的一个重要问题,它涉及到在图像或视频中检测出特定对象的位置和类别。近年来,深度学习已经成为目标检测领域的主流方法。本文对基于深度学习的目标检测方法进行了调查。
深度学习基于目标检测的方法可以分为两类:基于区域提取的方法和基于全卷积网络的方法。基于区域提取的方法包括R-CNN、Fast R-CNN、Faster R-CNN和Mask R-CNN等。这些方法首先使用选择性搜索或其他区域提取方法生成候选区域,然后对每个候选区域进行分类和回归。基于全卷积网络的方法包括YOLO、SSD和RetinaNet等。这些方法使用全卷积网络直接对整个图像进行分类和回归,从而实现端到端的目标检测。
在实际应用中,基于深度学习的目标检测方法已经取得了很大的成功。例如,在COCO数据集上,Mask R-CNN的平均精度达到了0.39,RetinaNet的平均精度达到了0.39。此外,这些方法在实时目标检测、多目标跟踪和目标分割等方面也取得了很好的效果。
总之,基于深度学习的目标检测方法已经成为计算机视觉领域的一个重要研究方向,未来还有很大的发展空间。
阅读全文