显着性结构模型:基于内容的图像检索新方法

需积分: 5 0 下载量 132 浏览量 更新于2024-08-12 收藏 4.53MB PDF 举报
"使用视觉视觉注意模型的基于内容的图像检索" 在计算机视觉领域,基于内容的图像检索(CBIR)是一项重要的任务,它旨在通过分析图像内容来寻找与查询图像相似的图像。传统的CBIR系统通常依赖于颜色、纹理和形状等基本视觉特征。然而,这种方法往往忽视了人类视觉系统在关注图像时的动态和选择性注意。因此,模拟视觉注意力机制以提升CBIR的性能成为了研究焦点。 本文提出了一种新颖的计算视觉注意力模型,称为显着性结构模型,用于增强CBIR的效果。显着性结构模型引入了新的视觉提示——颜色量,结合边缘信息,来检测图像中的显著区域,而非仅仅依赖传统的颜色、强度和方向特征。颜色量是一种考虑颜色分布的度量,可以更精确地捕捉到视觉显著性。同时,利用边缘信息有助于识别物体轮廓,进一步提升显著区域的定位准确性。 在抑制背景噪声方面,研究者采用了灰度共生矩阵(GLCM)的能量特征构建全局抑制图。GLCM是纹理分析的强大工具,它记录了像素对之间的相对位置和灰度级关系。通过其能量特征,可以有效地识别和抑制图像中的非显著部分,从而使显著区域更加突出。 为了更好地表达图像的结构信息,文章还提出了一种新的图像表示方法——显着性结构直方图。这种方法激发了CBIR框架内的方向选择机制,使得图像的显著特征在不同方向上都能得到有效的编码。显着性结构直方图的引入,使得系统能够更全面地理解图像的显著结构,从而提高检索的准确性和鲁棒性。 实验部分,作者在两个不同的数据集上评估了所提算法的性能。结果显示,该算法相对于标准的 Bag-of-Words(BOW)基线和微结构描述符有显著的改进,证明了显着性结构模型和直方图在捕获和利用视觉注意力方面的有效性。 总结来说,这篇论文提出了一种综合考虑颜色、边缘和结构信息的视觉注意模型,通过显着性结构模型和直方图,提高了基于内容的图像检索的性能。这一方法不仅加深了对人类视觉系统理解的模拟,也为图像检索领域带来了新的理论和技术支持。