深度感知与视觉舒适度结合的3D视觉显著性计算新模型

0 下载量 28 浏览量 更新于2024-08-30 收藏 5.64MB PDF 举报
"本文介绍了一种新的深度感知和视觉舒适度引导的立体3D视觉显著性计算模型,该模型在3D图像的显著性计算中考虑了深度感知和视觉舒适度的影响。模型由2D图像显著性、深度显著性和基于视觉舒适度的显著性三部分组成,综合了颜色、纹理和空间位置等因素。" 3D视觉显著性建模是随着三维技术的快速发展而变得尤为重要的一项研究。传统二维(2D)显著性模型主要关注平面图像中的注意力吸引元素,但在立体3D场景中,深度信息和观看者的视觉舒适度对显著性预测起着关键作用。本文的贡献在于提出一种融合这两种因素的新模型,旨在更准确地模拟人类视觉系统在3D环境中的注意力分配。 首先,2D图像显著性是模型的基础,它通常涉及颜色对比、纹理差异和边缘检测等特征。颜色显著性通过分析颜色直方图和色彩对比度来确定,而纹理显著性则利用纹理差异度量来识别。空间位置信息则有助于确定图像中的兴趣点或区域。 其次,深度显著性引入了深度感知的概念。在3D场景中,物体的深度信息可以显著影响观众的注意力。例如,前景中的物体通常比背景物体更能引起注意。因此,模型会计算深度图,并根据深度差异和距离信息来量化每个像素的显著性。 最后,视觉舒适度是3D视觉体验中的一个重要考量因素。长时间观看不舒适的3D图像可能导致视觉疲劳甚至眼睛损伤。本文的模型引入了一个基于视觉舒适度的显著性组件,这涉及到对视差、闪烁、双目视差不匹配等因素的评估。这些因素与视觉舒适度密切相关,模型通过量化这些参数来降低不舒适感对显著性的影响。 为了构建这个模型,作者可能采用了机器学习方法,如深度神经网络,来学习这些特征之间的关系,并进行训练,以使模型能够预测不同场景中的3D视觉显著性分布。通过实验和对比,他们验证了新模型在预测准确性上的优越性,并讨论了其在3D内容理解和应用,如3D视频编码、3D广告设计和视觉搜索中的潜在价值。 这篇研究论文提出了一个深度感知和视觉舒适度导向的立体3D视觉显著性计算模型,该模型考虑了3D环境下的多方面因素,以更好地模拟人类视觉系统的注意力分配,对3D视觉相关领域的研究和应用具有重要的理论与实践意义。