单幅图像目标定位与三维重建:Canny边缘与概率Hough变换的应用

需积分: 41 57 下载量 13 浏览量 更新于2024-08-10 收藏 6.56MB PDF 举报
本文是一篇关于计算机科学的硕士论文,主要探讨了基于单幅结构化场景图像的目标定位与三维重建方法。作者是南京理工大学的于艳,专业为控制理论与控制工程,指导教师为陈青林。论文的核心内容围绕以下几个方面展开: 1. 边缘检测与目标识别:论文首先比较了不同边缘检测算法,如Sobel、Prewitt等,选择了Canny算子,因为它以其优良的性能(高精确度和抗噪能力)提取图像边缘。对于传统的Hough变换在时间和存储消耗上的局限性,作者引入了概率Hough变换,用于检测图像中的直线目标,通过拟合求取交点来确定灭点坐标,从而提高灭点计算的精度。 2. 摄像机参数估计:基于摄影测量学,论文重点研究了确定摄像机外方位角参数的方法,特别是旋转矩阵的确定,强调了精度的重要性。通过灭点信息,作者能够准确地获取摄像机的内、外参数,进而确定相机中心位置。 3. 长方体模型构建与精度提升:针对单幅图像中相对深度对长方体尺寸精度的影响,论文对相对深度算法进行了优化,旨在提高模型长、宽、高的精度。通过改进后的算法,作者能够计算出目标物体特征点的三维坐标,实现了目标物体的精确定位。 4. 虚拟现实与模型重建:利用VRML编程技术,论文实现了模型的重建与显示。为了减少纹理映射过程中的变形,图像被按照特定规则分割成多个小块,并贴到生成的模型表面,提高了重建的逼真度。 论文通过实例验证了所提出的算法的有效性和系统实现的可行性。这种基于单幅图像的目标定位与三维重建技术有广泛的应用前景,尤其是在城市规划、古建筑修复、基于图像的测量以及虚拟漫游等领域。论文的关键词包括单幅图像、目标定位、三维重建、灭点和VRML,全面展示了作者在计算机视觉领域的深入研究和实践成果。