深度学习驱动的卷积神经网络目标检测模型综述

需积分: 11 29 浏览量更新于2024-09-07 收藏 612KB PDF 举报

本文《基于卷积神经网络的目标检测模型综述》由许必宵等人撰写，主要探讨了深度学习技术兴起背景下，卷积神经网络在目标检测领域的广泛应用和发展。目标检测是计算机视觉的核心任务，它旨在从图像或视频中定位和识别出预定义的对象。文章首先回顾了目标检测的基本概念，明确了其在计算机视觉中的重要性，强调了深度学习特别是卷积神经网络（CNN）在提升检测性能中的关键作用。CNN因其特有的局部连接和权重共享特性，使得它们在处理图像特征时表现出强大的表达能力和位置不变性，这在目标检测中至关重要。接下来，作者详细介绍了几种常见的CNN架构在目标检测模型中的应用，例如Faster R-CNN、YOLO（You Only Look Once）系列、R-FCN（Region-based Fully Convolutional Networks）等，这些模型通过不同的策略来生成候选区域并进行精细的定位和分类。其中，Faster R-CNN引入了Region Proposal Network（RPN），显著提高了检测速度；YOLO则以其实时性和准确性而受到关注，而R-FCN则利用全卷积层实现了更高效的区域预测。论文着重讨论了候选区域生成和回归方法两种核心策略。候选区域方法如Fast R-CNN和Faster R-CNN，通过选择和调整不同尺度的特征来捕捉不同大小的目标，从而改善了小目标检测的精度。回归方法则是针对选定的候选区域进行坐标预测，以更精确地定位对象。作者通过对多个数据集的对比分析，深入剖析了这些模型的优点和不足。例如，Faster R-CNN的精确度较高但计算成本较高，而YOLO虽然速度快但可能牺牲一定的准确度。通过这样的评估，文章提出了一些优化方案，如改进候选区域生成算法、优化网络结构、结合多尺度特征等，以进一步提升模型的性能。《基于卷积神经网络的目标检测模型综述》为我们提供了一个全面的视角，深入解析了卷积神经网络在目标检测领域的最新进展，对于理解深度学习在计算机视觉中的实际应用具有重要参考价值。读者可以从中学到如何设计和优化目标检测模型，以及如何根据实际需求权衡速度与精度之间的平衡。

基于卷积神经网络的目标检测模型综述

许必宵

1,3

宫婧

2,3

孙知信

2,3

（南京邮电大学物联网学院，江苏南京 210003）

（南京邮电大学现代邮政学院，江苏南京 210003）

（南京邮电大学宽带无线通信与传感器网络技术重点实验室，江苏南京 210003）

摘要：目标检测一直是计算机视觉领域中的研究热点。随着深度学习技术的迅猛发展，基于

卷积神经网络的目标检测模型逐渐被广泛关注。本文主要目的是对基于卷积神经网络的目标

检测模型的现状进行综述。首先，本文介绍了目标检测的相关基础，特别罗列了一些目标检

测模型中常用的卷积神经网络结构，也介绍了检测模型常用的梯度下降法训练方式。然后，

本文重点从候选区域和回归方法两类对近几年提出的优秀模型进行综述，候选区域一类也创

新地使用特征尺度进行区别，说明了多尺度特征能够有效提高小尺度目标检测精度。对于每

一类检测模型，本文根据同一数据集上的检测结果分析这些模型的优势与缺陷，最后根据分

析的结果总结一些基于卷积神经网络的目标检测模型的优化方案。

关键词：卷积神经网络，目标检测，深度学习，计算机视觉

中图分类号：TP301

A Survey of Object Detection

Models Based on Convolutional Neural Networks

XU Bi-xiao

1,3

GONG Jing

2,3

SUN Zhi-xin

2,3

(College of Internet of Things,Nanjing University of Posts and Telecommunications,NanJing JiangSu,210003)

(School of Modern Posts,Nanjing University of Posts and Telecommunications,NanJing JiangSu,210003)

(Key Laboratory of Broadband Wireless Communication and Sensor Network Technology, Nanjing University of Posts

Telecommunications, Nanjing JiangSu,210003)

Abstract: Object detection has always been a research hotspot in the field of computer vision. With the rapid

development of deep learning technology, the object detection model based on convolutional neural network is

widely concerned. The main purpose of this paper is to review the current status of object detection models based

on convolutional neural networks. First of all, this paper introduces the relevant basis of target detection, especially

the convolutional neural network structure commonly used in some object detection models, and also introduces

the gradient descent method training method commonly used in detection models. Then, this paper summarize the

excellent models proposed in recent years from region-based and region-free and compare the test results. The

region-based models is distinguished with feature scales intelligently, which shows that multi-scale features can

effectively improve the accuracy of small-scale object detection. For each type of detection model, this paper

analyzes the advantages and disadvantages of these models based on the results on the same data set. Finally, based

on the analysis results, some optimization schemes based on the convolutional neural network are proposed.

Keywords: convolutional neural network, object detection, deep learning, computer vision

基金项目：国家自然基金项目（No.61373135），江苏省研究生科研与实践创新计划项目（No.

KYCX17_0775）。

作者简介：许必宵，男，1993 年生，在读硕士，工程师，研究方向为目标检测技术。宫婧，女，1978

年生，博士，副教授，研究方向为深度学习、计算机视觉等。孙知信，男，1964 年生，博士后，教授，研

究领域为信息安全、人工智能与计算机视觉。

网络出版时间：2019-06-27 11:14:20

网络出版地址：http://kns.cnki.net/kcms/detail/61.1450.TP.20190627.1105.050.html

下载后可阅读完整内容，剩余7页未读，立即下载

qq_35661439

粉丝: 4

深度学习驱动的卷积神经网络目标检测模型综述

卷积神经网络CNN以及几种经典模型

基于深度卷积网络的目标检测技术综述_胡金辰.pdf

基于卷积神经网络的目标检测模型综述.pdf

基于深度学习的目标检测算法综述_吴雨露.pdf

基于卷积神经网络的目标检测算法综述 (2).pdf

基于卷积神经网络的目标检测算法综述.pdf

基于卷积神经网络的目标检测研究综述.pdf

基于卷积神经网络的人脸检测综述.pdf

基于深度卷积神经网络的目标检测研究综述.pdf

基于卷积神经网络的目标跟踪算法综述.pdf

最新资源