基于VoVNet-FCOS的道路行人目标检测算法优化
需积分: 5 135 浏览量
更新于2024-08-13
1
收藏 504KB DOCX 举报
"基于VoVNet-FCOS的道路行人目标检测算法研究"
这篇文档是关于深度学习在行人目标检测领域的应用,具体是通过改进现有的FCOS(Fully Convolutional One-Stage Object Detection)算法来提升检测性能。FCOS是一种基于深度卷积神经网络的一阶段目标检测算法,它摒弃了传统的区域提议步骤,直接从特征图中预测边界框和类别,从而提高了检测速度。
文档指出,当前的行人检测算法由于道路行人的特殊性和复杂性,在速度和精度上存在不足。为了解决这个问题,研究者们在FCOS的基础上进行了两方面的改进:
1. **网络基础结构的改进**:
- **VoVNet的引入**:用VoVNet替换原有的ResNet作为特征提取网络。VoVNet是一种高效型网络,设计上旨在平衡准确度和计算效率,适用于处理复杂的图像识别任务。
- **残差连接的增加**:在VoVNet中加入输入到输出的残差连接,这有助于信息的流畅传递,缓解梯度消失问题,提高网络训练的效率和效果。
- **eSE注意力机制**:在最后的特征层上应用了eSE(Squeeze-and-Excitation)注意力机制。eSE能够自适应地调整特征通道的重要性,增强模型对关键特征的识别能力。
2. **损失函数的改进**:
- **GIOU Loss的应用**:为了更好地衡量预测框与真实框的重合程度,论文采用了GIOU(Generalized Intersection over Union)Loss替代传统的IOU Loss。GIOU Loss不仅考虑了两框的交集,还考虑了它们的并集,因此能更全面地评估预测框的质量,有助于提高检测的准确性。
实验结果显示,经过这些改进后,新的行人检测算法在平均精度(mAP)上提升了6.65%,同时保持了实时性,满足了实际应用的需求。这些改进对于智能驾驶辅助系统、交通监控等领域具有重要的实践意义,有助于提高系统的行人检测能力和安全性。
关键词:行人检测;卷积神经网络;FCOS;高效型网络;损失函数
该文档的研究工作聚焦于深度学习在行人检测中的优化,通过网络结构的调整和损失函数的改进,实现了性能的显著提升,对于深入理解和改进目标检测算法具有很高的参考价值。
2021-09-30 上传
2024-09-06 上传
2022-05-29 上传
Mfy.
- 粉丝: 0
- 资源: 1
最新资源
- Heimer:Heimer是用Qt编写的简单的跨平台思维导图,图表和笔记工具
- C0773839_W2020_MAD3125_MidTerm
- firmware_oneplus:仅从Oneplus 3、3T,5和5T设备的官方OxygenOS映像中提取固件和无线电,以创建可刷新的zip文件,以在Lineage OS上进行OTA更新。
- Analise-Algoritmo
- 参考资料-中国魏碑名帖.zip
- data-ppf.github.io:网站
- weather-app
- marvell-dove-pinctrl.rar_驱动编程_Unix_Linux_
- notes:记笔记应用程序,写下您的想法
- covid19前端
- ProfiM-开源
- WebShooter
- Magento-react:使用ReactJS作为Magento的模板语言进行实验—该实验已经结束。 为了建立现代的Magento用户体验,请考虑使用https
- xianxingxiankuan.rar_绘图程序_Visual_C++_
- QtUsb:用于Qt的跨平台USB模块
- QA_Verification