SIFT特征检测算法代码分析与实现详解

需积分: 9 2 下载量 180 浏览量 更新于2024-07-16 收藏 968KB PDF 举报
SIFT特征检测代码分析 SIFT(Scale-Invariant Feature Transform)是一种经典的特征检测算法,广泛应用于计算机视觉和图像处理领域。本文对SIFT特征检测代码进行了详尽的分析,涵盖了常量介绍、数据结构说明、函数说明、函数调用关系、SIFT特征检测各步骤对应代码、参数设置以及参数影响分析等方面。 一、常量说明 在SIFT特征检测算法中,定义了多个常量,这些常量plays a crucial role在算法的实现中。例如,SIFT_INTVLS表示每组图片的采样间隔,SIFT_SIGMA表示初始高斯平滑参数sigma,SIFT_INIT_SIGMA表示假定输入图像的高斯模糊参数等。此外,还有许多其他常量,如SIFT_CONTR_THR、SIFT_CURV_THR、SIFT_IMG_BORDER等,这些常量的设置直接影响算法的检测结果。 二、数据结构说明 SIFT特征检测算法中使用了多种数据结构,如数组、链表、树形结构等。这些数据结构的设计和实现对算法的性能和效率产生了非常大的影响。例如,在 Scale Space 极值点检测中,使用了octave的数据结构来存储图像金字塔的信息。 三、函数说明 SIFT特征检测算法中包含了多个函数,每个函数都有其特定的功能。例如,_sift_features函数用于计算SIFT特征,get_keypoints函数用于获取关键点信息,draw_keypoints函数用于绘制关键点等。这些函数之间存在紧密的调用关系,共同实现了SIFT特征检测的整个流程。 四、函数调用关系 SIFT特征检测算法的函数调用关系如图所示。整个算法流程可以分为四个步骤:构建高斯金字塔、尺度空间极值点检测、获取关键点主方向和关键点描述。每个步骤都对应着特定的函数调用关系,例如,_sift_features函数调用get_keypoints函数,而get_keypoints函数又调用了get_orientation函数等。 五、SIFT特征检测各步骤对应代码 SIFT特征检测算法可以分为六个步骤:输入图像初始化、构建高斯金字塔、构建高斯差分金字塔、极值点检测、求极值点描述符和关键点绘制。每个步骤都对应着特定的代码实现,例如,输入图像初始化对应的代码是读取输入图像和初始化图像金字塔。 六、参数设置 SIFT特征检测算法中有多个参数需要设置,例如,高斯金字塔参数、尺度空间极值点检测参数、求极值点主方向参数等。这些参数的设置直接影响算法的检测结果,例如,高斯金字塔参数的设置影响了图像金字塔的构建,而尺度空间极值点检测参数的设置影响了极值点的检测结果。 七、运行结果 SIFT特征检测算法的运行结果可以通过图像来表示,例如,beaver.png和beaver_xform.png的测试结果。这些结果展示了SIFT特征检测算法的有效性和robustness。 八、参数分析 SIFT特征检测算法中参数的设置对检测结果产生了非常大的影响。例如,高斯金字塔参数的设置影响了图像金字塔的构建,而尺度空间极值点检测参数的设置影响了极值点的检测结果。因此,参数的设置需要根据实际情况进行调整,以确保检测结果的准确性和可靠性。
1280 浏览量
SIFT概述p200 在前面我们学习了角点检测技术,比如Harris等。它们具有旋转不变特性,即使图片发生了旋转,我们也能找到同样的角点,很明显即使图像发生旋转之后角点还是角点。但是如果我们对图像进行缩放,那么角点就可能不再是角点了。所以基于这个问题,尺度不变特征变换(SIFT)出现了,这个算法可以帮助我们提取图像中的关键点并计算它们的描述符。 • 尺度空间极值检测 • 关键点精准定位与过滤 • 关键点方向指派 • 描述子生成 1. 尺度空间极值检测: (由Harris的弊端)我们知道在不同的尺度空间不能使用相同的窗口检测极值点。对于小的角点要用小的窗口。对于大的角点只能使用大的窗口。为了达到这个目的我们需要使用尺度空间滤波器(由一些列具有不同方差sigma的高斯卷积核构成)。 使用具有不同方差值sigma的高斯拉普拉斯算子(LoG)对图像进行卷积,LoG由于具有不同的方差值sigma所以可以用来检测不同大小的斑点,简单来说方差sigma就是一个尺度变换因子,使用一个小方差sigma的高斯卷积核可以很好地检测出小的角点,而是用大方差sigma的高斯卷积核可以很好打的检测出大的角点。 我们可以在尺度空间和二维平面中检测到局部最大值,如(x,y,sigma),这表示sigma尺度中(x,y)点可能是一个关键点。但是这个LoG的计算量非常大,所以SIFT算法使用高斯差分算子(DoG)来对LoG做近似。 DoG是下图这组具有不同分辨率的图像金字塔中相邻的两层之间的差值。 在DoG搞定之后,就可以在不同的尺度空间和2D平面中搜索局部最大值了。对于图像中的一个像素点而言,它需要与自己周围的8个点和上下层18个点相比,如果是局部最大值,它就可能是一个关键点。基本上关键点就是图像在相应尺度空间中的最好代表。如下图所示: 该算法中默认尺度空间为5,经过DoG算法得到4层。所以该算法的作者在文章中给出了SIFT参数的经验值:octave =4。 2. 关键点(极值点)定位---删边界点,去掉低灰度值点 kp 我们通过contrastThreshold阈值来将关键点修正以得到更正确的结果。作者使用尺度空间的泰勒级数展开来获得极值的准确位置,若极值点的灰度值小于阈值(0.03)就会被忽略掉。 DoG算法对边界非常敏感,所以我们必须要把边界去除。我们知道Harris算法除了可以用于角点检测之外还可以用于检测边界。作者就是使用了同样的思路。作者用了Hessian矩阵计算主曲率。从Harris角点检测的算法中,我们知道当一个特征值远远大于另一个特征值检测到的是边界。所以他们使用了一个简单的函数,如果比例高于阈值(opencv中称为边界阈值),这个关键点就会被忽略。文章中给出的边界阈值为10.。 3. 为关键点(极值点)指定方向参数 ,描述符生成: des1 现在我们要为每一个关键点赋予一个反向参数,这样它才会具有旋转不变性。 获取关键点(所在尺度空间)的邻域,然后计算这个区域的梯度级和方向,根据计算得到的结果来创建一个方向直方图,其中直方图的峰值为主方向参数,如果其它的任何柱子的高度高于峰值的80%,则被认为是辅方向。 新的关键点描述被创建了。选取与关键点周围一个16*16的邻域,把它分成16个4*4的小方块,为每个小方块创建一个具有8个bin的方向直方图。总共加起来有128个bin,由此组成了128的向量就构成了关键点的描述符。 而代码sift = cv.xfeatures2d.create_SIFT() kp,des=sift.detectAndCompute(gray,None)这两句话的原理就是1-3 4. 关键点匹配 采用关键点特征向量的欧式距离作为两幅图像中关键点的相似性判定度量。取第一个图的某个关键点,通过遍历找到第二幅图像中的距离最近的那个关键点。cv.BFMatcher,match()就是这个原理,1对1特征点,即返回最佳匹配。 而在有些情况下,第二个距离最近的关键点与第一个距离最近的关键点靠的太近,这可能是由于噪声等引起的,此时要计算最近距离与第二近距离的比值,如果比值大于0.8,就会忽略掉。而cv.BFMatcher.knnMatch就是基于这个原理 cv.BFMatcher.knnMatch可以指定每个关键点返回k个最佳匹配,这里不妨令k=2。 源码: img1 = cv.imread("E:/opencv/picture/test1.jpg") img2 = cv.imread("E:/opencv/picture/test2.jpg") gray1 = cv.cvtCo