目标检测20年演进:从HOG到YOLO,深度学习的革新之路
需积分: 17 16 浏览量
更新于2024-08-05
收藏 1.26MB DOCX 举报
"Object Detection in 20 Years:A Survey(笔记).docx - 对过去20年目标检测算法的全面回顾与总结"
在过去的20年里,目标检测技术经历了显著的发展,从传统方法到深度学习的革新,极大地推动了计算机视觉领域的进步。这篇笔记概述了关键的技术演变和主要的数据集,以及评估指标。
一、目标检测算法
1. 传统方法:
- HOG Detector(方向梯度直方图):利用图像局部区域的梯度信息来描述对象的形状特征。
- DPM(Deformable Part Models):基于部件的模型,可以处理目标的形变和姿态变化。
2. CNN基的两阶段检测器:
- RCNN(2014):首次将卷积神经网络引入目标检测,通过提取区域建议然后进行分类和边界框调整。
- SPP-Net(空间金字塔池化层):解决了不同大小区域的固定尺寸输出问题。
- Fast R-CNN:改进了RCNN的速度,通过共享卷积层的计算。
- Faster R-CNN:引入了区域提议网络(RPN),实现端到端训练。
- FPN(特征金字塔网络):构建多尺度特征图,增强了小目标检测能力。
3. CNN基的一阶段检测器:
- YOLO(You Only Look Once):单次预测,速度快但精度稍低。
- SSD(Single Shot MultiBox Detector):结合了多尺度特征,同时预测边界框和类别。
- RetinaNet:通过Focal Loss解决了类别不平衡问题,提高了小目标检测性能。
二、数据集:
- PASCAL VOC:一个标准的目标检测和分割数据集,包含20个类别。
- ILSVRC(ImageNet Large Scale Visual Recognition Challenge):大型图像识别挑战,用于评估深度学习模型的泛化能力。
- MS COCO:更复杂、更丰富的数据集,包含80个类别和丰富的实例分割信息。
- OpenImages:谷歌的开放图像数据集,提供大规模的多类别标注。
三、评估指标:
- FPPW(False Positive Per Window)、FPPI(False Positive Per Image):早期评估窗口级别的错误率。
- AP(平均精度)、mAP(mean Average Precision):目前常用的评价指标,衡量检测器在不同IoU阈值下的精度。
- IoU(Intersection over Union):计算两个边界框重合部分占总面积的比例,用于评估检测框的质量。
四、技术进化:
- 多尺度检测:如SPP-Net和FPN,解决不同尺度目标的检测问题。
- 锚点机制:如YOLO和SSD,预先定义多个比例和纵横比的参考框,以覆盖多种目标大小。
- 端到端训练:Faster R-CNN和后续方法实现了整个目标检测过程的端到端学习。
这篇笔记提供了一个简明的历史概览,展示了目标检测领域从传统方法到深度学习的转变,以及随之而来的算法优化和数据集的发展,对于理解这一领域的重要进展非常有帮助。
2020-04-15 上传
2020-10-07 上传
2019-10-27 上传
plastictime
- 粉丝: 1
- 资源: 1
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析