基于直方图交核的SVM图像分类方法

0 下载量 155 浏览量 更新于2024-08-26 收藏 577KB PDF 举报
本文主要探讨了一种基于直方图相交核(Histogram Intersection Kernel, HIK)的图像分类方法。该研究发表于2015年的《计算机与通信》(Journal of Computer and Communications)第三期,158-163页,doi:10.4236/jcc.2015.311025。作者是汉斌·Xi和添添·Chang,他们来自西安邮电大学科学学院,中国西安。 文章的核心思想是将直方图相交核应用到支持向量机(Support Vector Machines, SVM)的图像分类框架中。首先,图像被分割成若干块,每个块采用尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)进行描述,这是一种常用的图像特征提取方法,它能够保持在不同尺度和旋转下的不变性。这样做的目的是为了提取图像的关键视觉特征,提高分类的稳定性和准确性。 接着,k-means聚类算法被用来对SIFT描述符进行分组,每个组代表一个视觉关键词。这种方法有助于减少数据维度,同时突出图像中的关键特征模式。通过这种方式,图像被有效地编码为一组视觉词。 然后,每个图像中SIFT描述符的数量被统计,并构建出各自的直方图。直方图反映了图像的分布特性,而直方图相交核则通过计算两个直方图的交集来度量它们之间的相似性。相比于传统的内积或余弦相似度,直方图相交核更关注两者共有的部分,这使得它在处理图像类别具有重叠特征的情况下更具优势。 最后,利用构建的直方图相交核,支持向量机模型进行训练和分类。这种方法结合了SIFT特征的鲁棒性和HIK的特性,能够在一定程度上抵抗图像变化带来的影响,从而提高图像分类的性能。 这篇研究提供了一个创新的图像分类策略,利用直方图相交核来增强支持向量机的分类能力,特别适用于那些特征重叠或具有复杂视觉结构的图像。对于图像处理和机器学习领域的研究者来说,这篇文章不仅提供了新的理论支持,也提供了实际应用的指导,有助于提升图像分类任务的准确性和效率。