单幅图像目标定位与三维重建:基于Canny边缘检测与摄影测量方法

需积分: 41 57 下载量 123 浏览量 更新于2024-08-10 收藏 6.56MB PDF 举报
本篇硕士学位论文深入探讨了计算机科学领域的一个重要交叉学科问题——基于单幅图像的目标定位与三维重建。作者于艳,专业背景为控制理论与控制工程,针对南京理工大学的研究环境,将摄影测量学与虚拟现实技术相结合,对图像处理技术进行了创新性应用。 论文首先介绍了边缘检测算法的选择,提出了使用Canny算子来提取图像边缘,因为相比于传统的Hough变换,Canny算子具有计算效率高、占用存储空间少的优点。接着,针对Hough变换在检测目标直线时存在的耗时和存储问题,作者提出采用概率Hough变换,通过拟合求交点的方式提高了灭点(消失点)的精确度,这是定位过程中的关键步骤。 进一步地,论文着重研究了摄像机内外参数的确定,特别是在确定外方位角元素时,探讨了不同的方法,并实践证明了某一种精度更高的方法用于旋转矩阵的估计。这一部分强调了摄影测量学在计算机视觉中的核心作用。 在三维重建环节,作者将目标物体转换为长方体模型,并针对单幅图像中深度信息的精度问题进行了优化,特别关注了相对深度算法的改进,以提升长方体模型的尺寸参数精度。这一步骤有助于准确计算出目标物体特征点的三维坐标,从而实现精确的目标定位。 论文还利用VRML(Virtual Reality Modeling Language)编程技术实现了模型的重建与显示,通过纹理映射技术,通过将图像分割成小块并均匀地映射到模型表面,有效地降低了模型表面纹理的变形,提高了重建的逼真度。 最后,通过实际案例验证了所提算法的有效性和系统的可行性,指出这种方法在城市规划、古建筑的重建与保护、基于图像的测量以及虚拟漫游等应用领域具有广泛前景。关键词包括单幅图像、目标定位、三维重建、灭点和VRML,这些技术的结合展示了计算机视觉在现实生活中的强大潜力和实用价值。