GBVS算法:一种基于图的视觉显著性模型

5星 · 超过95%的资源 需积分: 0 533 下载量 174 浏览量 更新于2024-09-20 7 收藏 265KB PDF 举报
"这篇论文介绍了GBVS(Graph-Based Visual Saliency)算法,这是一种用于提取人眼感兴趣区域的视觉显著性模型。与Itti模型相比,GBVS在生成显著图时采用了马尔科夫链的平稳分布。该算法分为两步:首先在特定特征通道上形成激活图,然后进行归一化处理,突出显著性并允许与其他地图组合。GBVS模型简单且具有生物学合理性,因为它可以自然地并行化。在对108张自然图像的749个变体进行的人类注视预测中,GBVS模型达到了98%的ROC面积,而Itti & Koch的经典算法只达到84%。" GBVS算法原理及步骤: 1. 特征通道激活图:GBVS首先在图像的不同特征通道(如颜色、纹理、边缘等)中计算激活图。这些特征反映了图像中可能吸引人注意力的区域。通过这种方式,模型能够捕捉到视觉刺激的各种方面,例如鲜艳的颜色或强烈的对比度。 2. 马尔科夫链与平稳分布:在生成显著图的过程中,GBVS使用马尔科夫链来建模相邻像素之间的依赖关系。马尔科夫链的平稳分布表示系统最终将达到的状态,其中每个状态的概率反映了其在长期观察中的稳定性。在视觉显著性上下文中,这可以理解为在没有外部干预的情况下,视觉注意力自然会倾向于的区域。 3. 归一化处理:在得到特征通道的激活图后,GBVS通过归一化处理来增强那些在多通道中都显著的区域。这种方法有助于消除背景噪声,同时保留和突出那些在多个特征维度上都吸引人的区域。 4. 结合与优化:归一化处理后的激活图可以相互结合,进一步提升显著性的估计。这使得模型能够处理复杂场景,整合来自不同特征的信息,从而更准确地预测人类的注视点。 5. 生物学合理性与并行性:GBVS模型的简单性和并行性使其在生物学上显得合理,因为大脑的视觉系统可能就是通过类似的方式并行处理信息。这种并行性使算法在计算效率上具有优势,能够在大规模数据集上快速运行。 6. 性能评估:通过与基于人类的控制实验进行比较,GBVS模型在预测人类在自由观看场景下的注视点位置方面表现出色。其98%的ROC(受试者操作特性曲线)面积远超Itti & Koch的经典算法,显示了GBVS在视觉显著性预测上的优越性能。 总结来说,GBVS算法是通过马尔科夫链和归一化处理相结合,实现对图像中人眼感兴趣区域的高效、精确提取。其生物学上的合理性以及出色的预测能力,使得GBVS在视觉注意力研究和应用领域具有重要价值,比如在交互式系统、视频摘要、广告定位等方面都有潜在的应用前景。