基于稀疏表示的图像检索:分离词汇与特征融合方法

0 下载量 11 浏览量 更新于2024-08-31 1 收藏 951KB PDF 举报
本文主要探讨了"Separable Vocabulary and Feature Fusion for Image Retrieval based on Sparse Representation"这一主题,发表在《神经计算》(Neurocomputing)期刊上,该刊网址为www.elsevier.com/locate/neucom。文章关注的是图像检索领域中的关键方法,特别是基于稀疏表示的视觉词汇和特征融合技术。 在传统的图像检索模型中,如Bag-of-Visual-Words (BOW)模型,视觉词汇是其核心要素。BOW模型依赖于将图像分解成局部特征,然后将这些特征聚类形成一个词汇表,以描述图像的整体特征。然而,问题在于,为了保证检索的准确性,传统方法倾向于使用较大的词汇表。这样做的缺点是,随着词汇表规模的增长,查询过程可能会变得复杂且计算量大,导致检索效率降低,同时可能会引入噪声,影响结果的精确性。 文章提出了一种新颖的方法,即分离词汇(Separable Vocabulary)和特征融合(Feature Fusion)。通过将大的词汇表分解为更小、更易于处理的部分,这种分离词汇策略可以减少计算负担,同时保持一定程度的表达能力。特征融合则是在不同的特征子集之间集成信息,以便综合多个视角来提高图像的描述精度,从而改善检索性能。 作者团队来自北京交通大学、北京的关键信息科学与网络技术实验室、中央民族大学信息工程学院、俄罗斯顿河畔罗斯托夫国立技术大学无线电电子系统系以及北京建筑大学科学院,他们共同研究了如何通过优化这两个方面来提高图像检索的准确性和效率。 研究的关键点包括但不限于:设计有效的算法来构建和管理分离词汇,探索不同特征选择和融合策略,以及如何在实际应用中平衡词汇大小、计算复杂度和检索质量的关系。此外,文中可能还涵盖了实验设计,展示了使用这种方法在公开数据集上的性能对比,以及与传统方法的比较分析。 这篇论文对于那些关注图像检索技术改进,尤其是在稀疏表示理论背景下寻求更高效、更精确检索方法的研究者来说,具有重要的参考价值。它提供了在保持高检索精度的同时,通过创新的词汇管理和特征融合策略来优化图像检索性能的新思路。