目标检测20年演进:从HOG到YOLO,深度学习的革新之路
需积分: 17 102 浏览量
更新于2024-08-05
收藏 1.26MB DOCX 举报
"Object Detection in 20 Years:A Survey(笔记).docx - 对过去20年目标检测算法的全面回顾与总结"
在过去的20年里,目标检测技术经历了显著的发展,从传统方法到深度学习的革新,极大地推动了计算机视觉领域的进步。这篇笔记概述了关键的技术演变和主要的数据集,以及评估指标。
一、目标检测算法
1. 传统方法:
- HOG Detector(方向梯度直方图):利用图像局部区域的梯度信息来描述对象的形状特征。
- DPM(Deformable Part Models):基于部件的模型,可以处理目标的形变和姿态变化。
2. CNN基的两阶段检测器:
- RCNN(2014):首次将卷积神经网络引入目标检测,通过提取区域建议然后进行分类和边界框调整。
- SPP-Net(空间金字塔池化层):解决了不同大小区域的固定尺寸输出问题。
- Fast R-CNN:改进了RCNN的速度,通过共享卷积层的计算。
- Faster R-CNN:引入了区域提议网络(RPN),实现端到端训练。
- FPN(特征金字塔网络):构建多尺度特征图,增强了小目标检测能力。
3. CNN基的一阶段检测器:
- YOLO(You Only Look Once):单次预测,速度快但精度稍低。
- SSD(Single Shot MultiBox Detector):结合了多尺度特征,同时预测边界框和类别。
- RetinaNet:通过Focal Loss解决了类别不平衡问题,提高了小目标检测性能。
二、数据集:
- PASCAL VOC:一个标准的目标检测和分割数据集,包含20个类别。
- ILSVRC(ImageNet Large Scale Visual Recognition Challenge):大型图像识别挑战,用于评估深度学习模型的泛化能力。
- MS COCO:更复杂、更丰富的数据集,包含80个类别和丰富的实例分割信息。
- OpenImages:谷歌的开放图像数据集,提供大规模的多类别标注。
三、评估指标:
- FPPW(False Positive Per Window)、FPPI(False Positive Per Image):早期评估窗口级别的错误率。
- AP(平均精度)、mAP(mean Average Precision):目前常用的评价指标,衡量检测器在不同IoU阈值下的精度。
- IoU(Intersection over Union):计算两个边界框重合部分占总面积的比例,用于评估检测框的质量。
四、技术进化:
- 多尺度检测:如SPP-Net和FPN,解决不同尺度目标的检测问题。
- 锚点机制:如YOLO和SSD,预先定义多个比例和纵横比的参考框,以覆盖多种目标大小。
- 端到端训练:Faster R-CNN和后续方法实现了整个目标检测过程的端到端学习。
这篇笔记提供了一个简明的历史概览,展示了目标检测领域从传统方法到深度学习的转变,以及随之而来的算法优化和数据集的发展,对于理解这一领域的重要进展非常有帮助。
2020-04-15 上传
2020-10-07 上传
2019-10-27 上传
plastictime
- 粉丝: 1
- 资源: 1
最新资源
- Elasticsearch核心改进:实现Translog与索引线程分离
- 分享个人Vim与Git配置文件管理经验
- 文本动画新体验:textillate插件功能介绍
- Python图像处理库Pillow 2.5.2版本发布
- DeepClassifier:简化文本分类任务的深度学习库
- Java领域恩舒技术深度解析
- 渲染jquery-mentions的markdown-it-jquery-mention插件
- CompbuildREDUX:探索Minecraft的现实主义纹理包
- Nest框架的入门教程与部署指南
- Slack黑暗主题脚本教程:简易安装指南
- JavaScript开发进阶:探索develop-it-master项目
- SafeStbImageSharp:提升安全性与代码重构的图像处理库
- Python图像处理库Pillow 2.5.0版本发布
- mytest仓库功能测试与HTML实践
- MATLAB与Python对比分析——cw-09-jareod源代码探究
- KeyGenerator工具:自动化部署节点密钥生成