非局部空间冗余减少提升自底向上视觉显著性估计

0 下载量 148 浏览量 更新于2024-08-27 收藏 1.35MB PDF 举报
本文探讨了一种基于自底向上的视觉显著性估计的非局部空间冗余减少方法,该方法与传统方法不同,它不是通过测量像素强度的统计来衡量显著性,而是通过过滤掉重复和冗余的内容来确定视觉焦点。研究者们关注的是人类视觉系统(Human Visual System)中图像结构(Image Structures)的自相似性(Self-similarity),这是一种在视觉场景中普遍存在且对显著性判断有重要作用的特性。 为了分析这种重复空间结构的冗余,论文提出了一种非局部的自相似性分析方法。这种方法能够识别出视觉输入中的重复模式,并通过计算非局部的冗余系数来量化这种重复的程度。这个冗余系数被用来调整Shannon熵(Entropy),Shannon熵原本是基于像素强度的统计量来评估图像复杂度的。通过这种方式,非局部空间冗余减少技术能够生成更精确、更能反映视觉注意力(Visual Attention)分布的底部向上(Bottom-up)视觉显著性地图。 实验结果在三个公开可用的数据库上进行了验证,结果显示,这种冗余减少方法显著提高了视觉显著性估计的准确性。相比于传统的基于像素强度的方法,它不仅考虑了全局上下文信息,还能更好地模拟人类视觉系统在处理复杂视觉场景时的注意力机制。因此,这种方法对于计算机视觉任务,如目标检测、图像分类以及视频摘要等领域具有潜在的应用价值,可以提高算法的效率并增强对真实世界场景的理解。