图像检索:分层匹配追踪方法

0 下载量 94 浏览量 更新于2024-08-29 收藏 1.6MB PDF 举报
"本文介绍了‘图像检索与层次匹配追踪’的研究,由清华大学电子工程系和信息科学技术国家实验室的Shasha Bu和Yu-Jin Zhang共同撰写。他们提出了一种新的图像检索表示方法,利用具有显著区分能力的新类型特征。" 在当前的图像检索领域,尽管对象具有多尺度特性,但大多数现有的模型在固定尺度上执行特征提取,这不可避免地降低了整个系统的性能。为解决这一问题,作者引入了一种用于图像检索的层次稀疏编码架构,旨在探索多尺度线索。在较低层提取的稀疏编码会递归地传递到高层。通过这种机制,不同尺度的线索得以融合,从而提高了检索效果。 实验在Holidays数据集上进行,表明所提出的算法能够在较短的编码长度下实现优秀的检索性能。关键词包括:基于内容的图像检索(CBIR)、稀疏编码、层次匹配追踪以及特征向量集合(bag-of-features)。 在传统的图像检索系统中,通常使用固定的特征描述符,如SIFT或HOG,这些描述符在特定尺度上捕获局部信息。然而,这种方法忽略了不同尺度下的关键信息,可能丢失重要的细节。层次匹配追踪方法的引入,使得系统能够逐步解析图像,从不同尺度中提取更丰富的信息,增强了图像表示的鲁棒性和区分性。 稀疏编码是近年来图像处理和计算机视觉中的一个热门话题,它能够有效地将图像数据压缩成一组稀疏的系数,这些系数可以视为图像的高级表示。在本文的层次结构中,低层的编码不仅包含了原始信息,而且经过逐层传递和融合,逐渐捕获了更高层次的语义信息。 此外, bag-of-features(BoF)模型常用于图像分类和检索,通过量化局部特征来创建一个“视觉词袋”。在本文的方法中,BoF可能被用来构建图像的稀疏编码表示,进一步增强检索效率。 "图像检索与层次匹配追踪"的研究提供了一种改进的图像检索策略,通过层次稀疏编码和多尺度信息融合,提升了检索精度,同时降低了存储和计算成本。这种方法对于大规模图像数据库的高效检索具有重要意义,并且可以作为未来图像检索系统设计的基础。