YOLO在双目图像匹配中的应用研究

需积分: 5 2 下载量 200 浏览量 更新于2024-06-15 收藏 4.16MB PDF 举报
"基于YOLO的双目图像匹配方法研究" 这篇硕士论文主要探讨了基于YOLO(You Only Look Once)的双目图像匹配方法在计算机视觉领域的应用。随着图像处理和深度学习技术的进步,计算机视觉在自动驾驶、视频监控等多个领域扮演着重要角色。在特定的工程任务中,如高空测距,双目测距系统因其自动化和安全性成为优选方案。 双目图像匹配是计算机视觉中的关键技术,它能识别物体类别,建立图像间的视觉联系,进而获取有价值的视觉关系信息。然而,光照变化、尺度差异和视角变化等因素给图像匹配带来了挑战。传统的匹配算法可能因误匹配导致双目测距的不准确性,因此,结合深度学习的YOLO算法在限定区域内进行特征点匹配显得尤为关键。 YOLO是一种实时目标检测系统,以其高效和精确性而著名。论文深入探讨了YOLOv3的训练过程,制作了一个专门针对双目图像的训练数据集,该数据集包含了从KITTI数据集和自采集的双目图像中获取的目标(如汽车、自行车和人)的标注信息。通过K-means聚类算法,优化了候选框的宽高比,使其更适应双目图像中的目标特性。 针对小目标物体在双目图像中的识别问题,论文提出改进YOLOv3模型,以解决浅层网络到深层网络传递特征时可能出现的小目标信息丢失。通过增加更多尺寸的特征图,确保在多尺度预测时小目标物体的特征信息能够得到保留,从而提高匹配和测距的准确性。 这篇论文详细研究了双目图像匹配的理论基础,分析了YOLO算法在双目测距中的应用,并提出了一种针对双目图像的改进YOLO模型,旨在提升匹配效率和测距精度,对计算机视觉和深度学习领域的实践具有重要的参考价值。