紧凑且区分性的特征袋表示方法

0 下载量 13 浏览量 更新于2024-08-26 收藏 1.82MB PDF 举报
"特征袋的紧凑和区分性表示" 在计算机视觉领域,特征袋(Bag-of-Features, BOF)和空间金字塔匹配(Spatial Pyramid Matching, SPM)是两种广泛用于图像分类和检索的方法。这两种表示方式因其简洁和高效而备受青睐。然而,BOF向量的高维度特性带来了“维数灾难”问题,这不仅增加了计算和存储的复杂性,也可能会降低算法的效率。 本文主要探讨如何解决这一问题,提出了一种创新的无监督直方图向量降维框架。该框架首先通过对每个直方图对构建相异矩阵,来量化它们之间的差异。相异矩阵能够捕获不同直方图之间的相似度或差异性信息。接着,多维缩放(Multidimensional Scaling, MDS)技术被应用于这些相异矩阵,以在保持原始BOF向量邻域结构不变的前提下,将其映射到低维欧几里得空间中。 研究中,作者们探索了多种常用的衡量差异性的度量,如距离度量和核函数,以构建差异性矩阵。这些差异性矩阵作为降维模型的输入,有助于更好地理解和捕捉高维空间中的关键信息。实验结果显示,即使在非常低的维度下,采用BOF或SPM进行学习也能保持相当高的分类精度,而现有的方法在同样低的维度上可能无法达到相同的准确性。此外,这种紧凑的BOF表示不仅降低了计算成本,还进一步提高了分类的准确性。 最后,作者们证明了这种紧凑表示在图像检索任务中同样有效。这表明,通过优化和压缩BOF向量,可以实现更高效、更具区分性的特征表示,这对于处理大规模图像数据集尤其有益。 关键词:直方图、特征袋、相异矩阵、降维 文章历史:2014年4月30日收到初稿,2014年7月24日收到修订版,2014年9月30日接受,2015年5月28日在线发布。 这篇研究论文提供了一种解决高维BOF向量问题的新策略,通过无监督的降维方法,实现了更紧凑且区分性更强的特征表示,这对于图像分析和检索任务具有显著的性能提升。