双目图像行人检测与定位系统:SGM与Fast-YOLO改进

需积分: 12 0 下载量 118 浏览量 更新于2024-09-07 收藏 1.37MB PDF 举报
"该论文研究了一种基于双目图像的行人检测与定位系统,主要针对半全局匹配算法(SGM)在视差图匹配度低以及Fast-YOLO在小目标检测上的不足进行了改进。通过利用图像分割块的视差相似性,提出基于快速图像分割的SGM算法来提高立体匹配效果。同时,通过对Fast-YOLO网络模型的修改,提升网络分辨率,增强了对小目标的检测能力。实验结果显示,改进的算法和网络模型有效提升了匹配度和小目标检测性能,系统实现了行人检测和定位,并借助GPU实现了实时计算。该研究受到国家自然科学基金和河南省重点科技攻关项目的资助,由杨荣坚、王芳和秦浩等人合作完成。" 这篇论文深入探讨了基于双目图像的行人检测与定位技术。在传统的半全局匹配算法中,视差图的匹配度通常较低,这限制了立体视觉应用的精度。为解决这个问题,研究者提出了一个基于快速图像分割的SGM算法。该算法利用图像分割块之间的视差相似性,优化了匹配过程,从而提高了匹配度,使得双目图像的立体匹配更加准确。 另一方面,针对Fast-YOLO(You Only Look Once)目标检测算法在处理小目标时的局限性,研究者对Fast-YOLO网络模型进行了改进。他们通过提升网络的分辨率,增强了网络对小目标特征的捕获能力,从而改善了对行人这类小目标的检测性能。这一改进对于行人检测尤其重要,因为在复杂的背景和密集人群中,小目标的检测是一项挑战。 实验部分验证了这两种改进的有效性。基于快速图像分割的SGM算法显著提高了匹配度,而改进的Fast-YOLO网络则在小目标检测上展现出优越性能。整个行人检测与定位系统不仅能够准确地检测行人,还能够实现定位功能,且借助GPU的并行计算能力,确保了系统的实时性。 这项研究为双目视觉中的行人检测和定位提供了新的解决方案,对于自动驾驶、智能监控等领域的应用具有重要意义。通过结合传统算法的优化和深度学习网络的改进,该系统在提高匹配精度和检测效率的同时,也展示了未来立体视觉技术在实际应用中的巨大潜力。