"Kmeans与Meanshift与EM算法关系研究"

版权申诉

170 浏览量更新于2024-02-28 收藏 838KB PDF 举报

"聚类算法Kmeans与梯度算法Meanshift.pdf"是一篇关于聚类算法Kmeans和梯度算法Meanshift的论文。Kmeans算法是一种经典的聚类算法，在模式识别中得到了广泛的应用。基于Kmeans的变种算法也有很多，例如模糊Kmeans、分层Kmeans等。Kmeans算法和应用于混合高斯模型的受限EM算法是一致的。高斯混合模型广泛用于数据挖掘、模式识别、机器学习、统计分析。Kmeans的迭代步骤可以看成E步和M步，E步是固定参数类别中心向量重新标记样本，M步是固定标记样本调整类别中心向量。K均值只考虑（估计）了均值，而没有估计类别的方差，所以聚类的结构比较适合于特征协方差相等的类别。Kmeans在某种程度也可以看成Meanshift的特殊版本。Meanshift是一种概率密度梯度估计方法，无需求解出具体的概率密度，直接求解概率密度梯度。因此Meanshift可以用于寻找数据的多个模态（类别），利用的是梯度上升法。在06年的一篇CVPR文章上，证明了Meanshift方法是牛顿拉夫逊算法的变种。Kmeans和EM算法相似是指混合密度的形式已知情况下，利用迭代方法，在参数空。 Kmeans和Meanshift算法都是聚类算法，但它们有不同的特点和适用场景。Kmeans算法是一种划分型聚类算法，它通过不断迭代更新聚类中心的均值来最小化样本点与聚类中心之间的距离，将样本划分到距离最近的聚类中心所属的类别中。Kmeans算法的优点是收敛速度快，易于实现，但是对初始聚类中心的选择敏感，并且对异常点较为敏感。与Kmeans算法相比，Meanshift算法是一种基于概率密度梯度估计的聚类算法，它不需要预先设定聚类中心的个数，通过不断迭代调整样本点的位置来找到概率密度的局部最大值，从而得到聚类结果。Meanshift算法的优点是对初始值不敏感，能够自动发现数据中的多个模态，并且对噪声、异常点有较好的鲁棒性。但是Meanshift算法的缺点是计算量大，对数据规模较大的情况下不够高效。另外，Kmeans算法和EM算法在某些方面是相似的。EM算法是一种迭代的优化算法，用于估计含有隐变量的概率模型参数，其中的"E步"负责计算隐变量的期望，"M步"负责最大化似然函数。Kmeans算法的迭代步骤也可以看作是E步和M步，其中E步会重新标记样本点的类别，M步会调整类别中心的位置。因此，Kmeans和EM算法都是通过迭代优化来求解问题的算法。综上所述，Kmeans算法、Meanshift算法和EM算法在聚类问题中有着各自的特点和优势，可以根据具体的应用场景来选择合适的算法。希望通过本文的内容，可以更好地理解和使用这些聚类算法。

在 opencv 里面关于 meanshift 算法的应用还有两个函数 CVmeanshift 和 CVCAMshift 函数，都是用

于跟踪的，效果还不错。现在在视频跟踪里，meanshift 方法+卡尔曼滤波还是挺流行的。

SURF: speed up robust feature

SURF 特点：1.使用积分图像完成图像卷积（相关）操作，2，使用 Hessian 矩阵检测特征值；3，使用基于

分布的描述符（局部信息）。

兴趣点检测相关研究：

1998 Lindberg 介绍自动尺度选择的概念，允许检测图像中的兴趣点在它们的特征尺度上。他实验了 Hessian

矩阵的行列式和 Laplacian(和矩阵的迹一致)检测团状结构。

1998 Lowe 提出用 DOG 近似 LOG。

2001 Mikolajczyk 和 Schmid 重新定义了这个方法，名为 Harris-Laplace 和 Hessian-Laplace。使用 Harris

或 Hessian 矩阵的行列式来选择特征点的闻之，使用 Laplacian 选择尺度。

此外 Mikolajczyk（2005，2006）还做了一些算子的比较工作。从中可知：基于 Hessian 检测器比基于 Harris

检测器更稳定，重复检测性更好。此外，使用 Hessian 矩阵的行列式比使用它的迹更有优势。同时也发现

使用类似于 DOG 的近似方法可以提高速度但只损失很小的精度。

描述符的相关研究

图像特征点的描述符一个共同点是表达了兴趣点邻域内小尺度的特征分布。使得描述符的描述性更好，识

别性更高。SIFT 的特点正是掌握了空间域亮度模式的大量信息（基于直方图方法：8 个方向的箱格，4*4

像素）。描述了特征点邻域内点的梯度方向信息，共 128 维。

PCA-SIFT：36 维，匹配速度更快，但区分度下降，并且延长了特征的计算时间。

GLOH：区分度更高但是数据压缩花销时间太长。

2006 Grabner 使用积分图像近似 SIFT。可以达到和我们同样的速度。但是相比 SIFT 质量有所下降。（为

SURF 提供了重要信息积分图像）。

匹配算法：BBF（k-d tree）,balltrees, vocabulary trees, locality sensitine hashing.本文补充

提出了，使用 Hessian 矩阵的迹来显著提高匹配速度。在低维描述符下，任何算法的匹配速度都很快。

二．兴趣点检测。

使用 HESSIAN 矩阵的近似检测兴趣点。使用积分图像加快计算。

2001 Viola and Jones 提出积分图像的概念。

1998 Simard 提出的盒形计算框架使用积分图像。

本文的创新点：

使用近似的 Hessian 矩阵来求特征点。DOG 近似 LOG，盒形滤波近似不同的二次微分。

在 3*3*3 的邻域范围内寻找 Hessian 矩阵的行列式最大值。9*9 盒形滤波器相当于方差 1.2 的高斯函数。

图像尺度的改变是通过改变盒形滤波器尺寸实现的。尺度空间的分组时，相邻组首尺度滤波器大小之差

相差 2 倍。如第一二组差 6，则二三组差 12.为了减少计算时间，第一组采样间隔 1 像素，第二组 2 像素，

以此倍增。

特征点的精确定位即实现亚像素描述，通过 LOWE 文章中提出的泰勒级数展开，可求得。

三．特征点描述与匹配

剩余16页未读，继续阅读

G11176593

粉丝: 6944

"Kmeans与Meanshift与EM算法关系研究"

Kmeans与Meanshift算法探析：聚类与概率密度梯度估计

Kmeans聚类算法在MATLAB中的应用与优化

Kmeans与Meanshift算法在数据挖掘中的应用与关系

聚类算法Kmeans与梯度算法Meanshift (2).pdf

聚类算法Kmeans与梯度算法Meanshift (3).pdf

聚类算法Kmeans与梯度算法Meanshift.docx

聚类算法Kmeans与梯度算法Meanshift (3).docx

聚类算法Kmeans与梯度算法Meanshift (2).docx

聚类算法Kmeans与梯度算法Meanshift (4).docx

matlab实现Kmeans聚类算法 (3).pdf

最新资源