行人搜索中的目标导向组合扫描路径优化模型

需积分: 5 0 下载量 64 浏览量 更新于2024-08-12 收藏 4.75MB PDF 举报
行人搜索中的扫描路径组合模型是一个关键的计算机视觉研究领域,它旨在模拟和优化目标在图像或视频中定位的过程。目标搜索,作为计算机视觉中的一个重要任务,已引起广泛关注,因为它在诸多应用中如监控、自动驾驶和智能安防等领域发挥着重要作用。为了设计出更接近人类视觉搜索行为的算法,该模型结合了影响视觉搜索的三个主要因素: 1. **自上而下的目标信息 (Top-down Target Information)**: 这是指在搜索过程中,人们通常会根据预先存在的目标概念或者目标类别信息来指导视线。这种因素强调了目标的预期位置和特征,有助于快速缩小搜索范围,提高效率。在模型中,通过利用高级认知过程和知识库,自上而下的目标信息被用来引导生成的扫描路径。 2. **空间背景 (Spatial Context)**: 环境背景对人类寻找目标也有显著影响。人们往往会利用周围环境线索来辅助目标定位,例如物体的位置关系、纹理对比或运动模式。模型考虑了这些上下文信息,帮助生成的扫描路径更好地融入场景,避免在无关区域浪费精力。 3. **自下而上的视觉显著性 (Bottom-up Visual Saliency)**: 这是从低级视觉特征(如颜色、纹理和形状)自动产生的对视觉刺激的注意力吸引。虽然这对视觉搜索至关重要,但人类并不总是完全受其控制,可能会忽略某些显著但不相关的区域。模型中包含了对视觉显著性的处理,但发现其对搜索准确性的影响相对有限。 通过将生成的扫描路径与人类视觉的固定注视序列进行比较,研究人员评估了模型的有效性。评估策略不仅测试了单个因素的表现,还进行了不同因素组合的分析,以确定最佳权重。实验结果表明,自上而下的目标信息是影响搜索准确性最主要的因素,而自下而上的视觉显著性作用较小。然而,综合使用这三种因素的扫描路径组合,往往能提供比单一因素更优的搜索性能。 最终,提出的模型通过生成与人类视觉固定序列最为相似的扫描路径,证明了其作为最优选择的合理性。这一研究对于改进行人搜索算法以及理解人类视觉搜索机制具有重要意义,为进一步提升计算机视觉系统的实时性和准确性提供了新的思路。