立体视觉注意力引导的多视图图像 disparity 控制方法

0 下载量 27 浏览量 更新于2024-08-26 收藏 1.17MB PDF 举报
本文是一篇发表在《显示技术杂志》(JOURNAL OF DISPLAY TECHNOLOGY)第10卷第5期的2014年5月的研究论文,标题为"立体视觉注意力引导的多视图图像深度控制"。该研究由 Jianjun Lei (IEEE会员)、Shiqiu Li、Bingren Wang 和 Kefeng Fan 以及 Chunping Hou 合著,主要探讨了在三维立体显示中深度控制(disparity control)的重要作用,目标是创建出高质量的3D图像和视频,以提供逼真的视觉体验。 首先,作者深入解析了深度控制的基本原理,这涉及如何通过精确调整左右眼视差(disparity)来创造出立体感,使观众能够感知深度和空间。传统的深度控制通常依赖于固定的算法或规则,而本文则提出了一个创新的方法,即利用立体视觉注意力模型(stereoscopic visual attention model)来指导深度控制。 这个模型旨在捕捉观众对画面中不同区域的注意力,通过对关键点的识别,优先处理那些引起观众兴趣和关注的部分。这种方法更注重用户体验,使得立体显示中的深度变化更加符合用户的主观感受和视觉期待。例如,如果观众正在注视画面中的某个物体,该模型会自动调整该物体周围的深度,使其在3D场景中更加突出。 随后,作者将这种立体视觉注意力模型与深度控制原则相结合,设计了一种针对多视图图像的深度控制方法。这种方法能够实时根据观众的注意力动态调整各个视点之间的深度差异,从而在无须外部辅助设备的情况下实现自动立体(autostereoscopic)显示,提高观看者的沉浸式体验。 实验结果展示了这一方法的有效性,通过处理多视图序列,提出的深度控制策略能够准确地反映观众的视觉焦点,使得突出区域在立体显示中得到清晰和生动的表现。因此,本文不仅提升了3D显示技术的质量,还为未来的虚拟现实(VR)和增强现实(AR)应用提供了有价值的新思路。 这篇文章在3D显示技术领域具有重要的理论价值和实践意义,它探索了如何通过理解用户注意力来优化深度控制,从而增强立体视觉效果,为用户提供更加自然和身临其境的观影视觉体验。