深度学习双目感受野特性提升立体图像全参考质量评估

1 下载量 171 浏览量 更新于2024-08-30 收藏 2.5MB PDF 举报
"这篇研究论文探讨了通过学习双目感受野特性来对立体图像进行全参考质量评估的方法,旨在更准确地模拟人类视觉感知。在3D图像质量评估中,比2D图像评估面临更多挑战,直接应用2D图像质量度量标准并不适用。论文提出了一种新的全参考质量评估方法,利用双目感受野属性,以提高评估的准确性。具体来说,该方法在训练阶段学习多尺度字典,以表示图像的潜在结构;在质量估计阶段,基于稀疏系数向量的相位差和振幅差计算稀疏特征相似性指数,并考虑亮度变化计算全局亮度相似性指数,最终综合得出图像质量得分。" 在这篇发表于2015年10月《IEEE Transactions on Image Processing》的研究论文中,作者Feng Shao、Kemeng Li、Weisi Lin、Gangyi Jiang、Mei Yu和Qionghai Dai探讨了一个关键问题:如何更好地评估立体图像的质量。他们指出,由于3D图像的复杂性和与人类视觉系统的关联性,直接使用2D图像质量评估方法并不合适。 为了克服这个问题,研究人员提出了一个新颖的全参考质量评估框架,其核心是利用双目感受野(binocular receptive field)的特性。感受野是指视觉系统中神经元对视野中特定区域的响应,而在双目视觉中,这一概念扩展到两个眼睛对同一场景的不同视图。在训练阶段,他们构建了一个多尺度字典,该字典能够捕捉图像的多层次特征,从而更有效地表示图像的潜在结构。 在质量估计阶段,研究者利用这个字典估计出的稀疏系数向量,计算出稀疏特征相似性指数。这种方法考虑了系数的相位差异和幅度差异,这有助于捕捉图像在不同视点之间的变化。此外,他们还计算了全局亮度相似性指数,这一步骤考虑了立体图像中亮度的变化,因为亮度在立体图像的感知质量中起着重要作用。 最终,通过结合这两个相似性指数,可以得出一个综合的质量评分,这个评分更符合人类对于立体图像质量的主观评价。这种方法不仅提供了一个科学的量化工具,也为理解和改善3D图像的质量提供了理论支持。该研究为3D图像处理和显示技术的进步,以及相关领域的标准化评测提供了有价值的贡献。