递归神经网络LSTM-SSD在视频多目标检测中的应用
需积分: 50 70 浏览量
更新于2024-08-13
1
收藏 1.34MB PDF 举报
"基于递归神经网络的视频多目标检测技术,通过结合SSD和LSTM,解决了在低功耗设备上的实时视频目标检测问题。通过Bottleneck-LSTM层实现帧间信息的时序关联,降低了计算成本。同时,利用改进的动态卡尔曼滤波进行目标追踪,有效应对光照变化和遮挡情况。实验结果表明,改进的LSTM-SSD在复杂场景下提高了目标检测的准确率和多目标检测率,达到43 fps的检测帧率,实现了精度和速度的平衡。"
本文主要探讨了一种针对视频多目标检测的创新技术,特别是在低功耗移动和嵌入式设备上的应用。传统的基于深度学习的目标检测框架,如SSD(Single Shot MultiBox Detector),在处理大量数据时,往往存在计算资源需求高、实时性差的问题。为解决这一问题,研究者提出了LSTM-SSD,这是一种融合了递归神经网络(RNN,特别是LSTM,Long Short-Term Memory)和卷积神经网络(CNN)的多目标检测框架。
LSTM-SSD的独特之处在于其交织循环卷积结构,这种结构允许信息在时间维度上流动,即通过Bottleneck-LSTM层来捕捉帧间的特征映射,从而实现帧级信息的时序关联。Bottleneck-LSTM层的设计有效地减少了计算复杂性,使得网络能够在资源有限的设备上高效运行。
此外,为了应对视频中光照变化、大面积遮挡等导致的目标识别困难,该方法引入了时间感知信息,并结合改进的动态卡尔曼滤波算法进行目标追踪。卡尔曼滤波是一种经典的估计理论,用于预测和过滤噪声,而改进的动态版本则增强了其适应性和鲁棒性,尤其在面对光照变化和遮挡等动态环境时。
实验结果证明,改进的LSTM-SSD在多目标、复杂背景、光照变化、模糊和遮挡等挑战性场景下,表现出了显著的提升。平均准确率提高了5%至16%,平均准确率均值提升了4%至10%,多目标检测率提高了4%至19%。检测帧率达到了43 fps,基本满足了实时检测的需求。这些改进不仅提高了检测的准确性,还确保了算法在实际应用中的实时性能,为视频监控、自动驾驶等领域提供了有力的技术支持。
该研究成功地在保持高精度的同时,优化了低功耗设备上视频多目标检测的效率,为未来智能系统的实时视觉处理提供了新的思路和解决方案。
2018-10-13 上传
2021-09-26 上传
2021-04-12 上传
2021-03-30 上传
2021-09-26 上传
2021-09-25 上传
2021-09-25 上传
2021-03-20 上传
2021-09-19 上传
weixin_38583286
- 粉丝: 2
- 资源: 936
最新资源
- Angular实现MarcHayek简历展示应用教程
- Crossbow Spot最新更新 - 获取Chrome扩展新闻
- 量子管道网络优化与Python实现
- Debian系统中APT缓存维护工具的使用方法与实践
- Python模块AccessControl的Windows64位安装文件介绍
- 掌握最新*** Fisher资讯,使用Google Chrome扩展
- Ember应用程序开发流程与环境配置指南
- EZPCOpenSDK_v5.1.2_build***版本更新详情
- Postcode-Finder:利用JavaScript和Google Geocode API实现
- AWS商业交易监控器:航线行为分析与营销策略制定
- AccessControl-4.0b6压缩包详细使用教程
- Python编程实践与技巧汇总
- 使用Sikuli和Python打造颜色求解器项目
- .Net基础视频教程:掌握GDI绘图技术
- 深入理解数据结构与JavaScript实践项目
- 双子座在线裁判系统:提高编程竞赛效率