深度学习驱动的立体图像质量评估方法

需积分: 13 3 下载量 153 浏览量 更新于2024-08-26 收藏 2.46MB PDF 举报
"基于深度学习的立体图像质量评估" 在当今数字化时代,立体3D(S3D)图像和视频越来越普及,对它们的质量评估成为了一个关键的研究领域,以确保观众的体验质量(QoE)。传统的客观质量评估方法通常利用视差图来提取特征,但随着深度学习技术的发展,人们开始探索将其应用到S3D图像质量评估中。 这篇研究论文,"基于深度学习的立体图像质量评估",由Kai Wang、Jun Zhou、Ning Liu和Xiao Gu等人撰写,他们来自上海交通大学的图像通信与网络工程研究所和上海市数字媒体处理与传输重点实验室。论文提出了一种创新的S3D图像质量评估(S3DIQA)方法,该方法充分利用了深度学习的优势。 在该方法中,研究人员采用卷积受限玻尔兹曼机(CRBM)与因子第三阶RBM(FTO-RBM)相结合的模型作为特征提取工具。CRBM是一种无监督学习模型,能够从原始数据中学习高级抽象特征。而FTO-RBM则通过考虑更高阶的依赖关系,进一步增强了特征表示的能力。通过对预处理过的左右两幅图像进行特征提取,这种方法能够更准确地捕捉到S3D图像中的质量差异。 论文中的实验部分可能详细比较了新提出的深度学习方法与其他传统方法在预测用户感知质量方面的性能。通常,这些比较会包括相关性分析,如Pearson相关系数和SROCC(结构相似性秩相关系数),以及可能的视觉一致性评价。此外,可能还会通过大量的主观评估实验结果来验证模型的准确性。 深度学习在S3D图像质量评估中的应用开辟了新的研究方向,因为传统的基于统计和几何的方法可能无法完全捕捉到复杂的视觉感知效应。通过深度学习模型,可以模拟人眼对立体图像的复杂感知过程,从而提供更接近于人类感知的评估结果。 总结来说,这篇论文贡献在于: 1. 提出了一种结合CRBM和FTO-RBM的深度学习模型,用于S3D图像的质量评估。 2. 展示了深度学习在提取立体图像特征方面的优势,特别是对于复杂视觉效果的捕获。 3. 可能通过广泛的实验验证了该方法的预测性能,与传统方法进行了对比,并与主观评估结果相一致。 这篇研究不仅对学术界有重要意义,也为S3D图像和视频的编码、传输和显示提供了更精确的质量控制手段,有助于提升整体的用户体验。