利用空间相关性提升视觉对象检索效果

0 下载量 133 浏览量 更新于2024-07-15 收藏 973KB PDF 举报
"这篇研究论文探讨了在视觉对象检索中探索空间相关性的方法,由北京大学、悉尼科技大学、香港理工大学和北京航空航天大学的研究人员共同撰写。文章指出,基于视觉词汇(BOVW)的图像表示虽然在内容为基础的图像检索(CBIR)中取得了显著进步,但它忽视了自然图像中视觉词汇之间的空间相关性,导致不稳定视觉特征时产生噪声偏置。" 正文: 近年来,基于视觉词汇(Bag-of-Visual-Words, BOVW)的图像表示在内容为基础的图像检索(Content-Based Image Retrieval, CBIR)领域取得了显著的进步。然而,这种方法存在一个主要局限性:它不考虑视觉词汇在自然图像中的空间相关性。当对应的视觉特征不稳准时,这可能导致生成的视觉词汇偏向于噪声。 该论文提出了一种新的方法,通过从大量自然图像的小仿射不变区域提取视觉词汇共现来构建视觉词共现矩阵。这个矩阵揭示了不同视觉词汇在空间上的相互关系。基于此共现矩阵,研究人员设计了一个新颖的高阶预测器,旨在加速生成具有空间相关性的视觉词汇。这个预测器能够更准确地捕捉到相邻区域间的视觉特征关联,从而减少噪声影响。 为了进一步优化这一过程,他们还引入了惩罚树(Penalty Tree, PTree)结构,用于在预测后继续生成视觉词汇。PTree的设计使得在保持检索效率的同时,能够更好地处理空间相关性的复杂性。 此外,论文提出了两种共现权重相似度测量方法。第一种方法可能侧重于近邻视觉词汇的共现频率,强调局部空间相关性;第二种方法可能考虑更广泛的上下文,以捕捉更远距离的视觉词汇关联,体现全局空间模式。这些共现权重的计算有助于提高检索结果的准确性,使得检索系统能够更好地理解和利用图像中的空间信息。 这篇研究论文为改进视觉对象检索提供了新视角,强调了空间相关性在图像表示和检索中的重要性,并通过创新的数据结构和算法实现了这一目标。这不仅有助于提高CBIR系统的性能,还有望推动未来计算机视觉领域的进一步发展。