深度视频质量评估:时空视敏度的卷积神经聚合网络分析

0 下载量 63 浏览量 更新于2024-06-20 收藏 2.07MB PDF 举报
"本文介绍了一种名为深度视频质量评估器(DeepVQA)的新方法,该方法结合了时空视敏度和卷积神经聚合网络(CNAN),用于精确预测视频的质量感知。DeepVQA旨在模拟人类视觉系统(HVS)的工作原理,特别是考虑到时间和空间因素在感知质量中的影响。通过卷积神经网络(CNN)和CNAN,模型能够识别并量化视频中的时空敏感性,同时利用注意力模型处理时间变化的失真。在LIVE和CSIQ视频数据库的测试中,DeepVQA的表现优于传统方法,相关系数提高了1.5%以上,预测精度提升超过100%。" 深度视频质量评估器(DeepVQA)是针对视频质量评估(VQA)领域的一个创新解决方案,它着重解决如何将时空感知融入到VQA算法中的问题。传统的统计和计算模型在处理时空感知时存在局限性,而DeepVQA通过引入深度学习技术,尤其是CNN和CNAN,克服了这些局限。CNN被用来捕捉视频中的空间特征,而CNAN则进一步整合了时间维度的信息,形成时空敏感性的量化评估。 文章指出,人类视觉系统在观看视频时,不仅考虑空间特性,还对时间变化非常敏感。例如,某些局部失真可能会因为运动或者相邻帧的差异而被强化或掩盖。因此,DeepVQA通过学习过程,可以生成预测的时空敏感图,这有助于识别哪些区域的失真会影响观看者的感知质量。 此外,为了解决失真随时间变化的问题,DeepVQA提出了一种时间池方法,它采用注意力模型来处理不同时间点的失真影响。这种方法有助于更准确地估计由于网络条件不稳定导致的视频质量波动。 在实验部分,DeepVQA在LIVE和CSIQ这两个常用的视频质量评估数据库上展示了卓越的性能。与现有方法相比,DeepVQA的相关系数提高了1.5%,并且在预测精度上取得了超过100%的提升。这些结果表明,DeepVQA能够更有效地模拟人类对于视频质量的感知,从而在视频流服务中提供更准确的质量预估,助力提供更优质的用户体验。 关键词涵盖了视频质量评估、视觉敏感度、卷积神经网络、注意力机制、人类视觉系统以及时间池等核心概念,强调了DeepVQA在理解和模拟人类观看视频时的感知质量方面所做的贡献。这项工作对于优化视频编码、传输和流媒体服务具有重要意义,特别是在网络条件不稳定的环境中,确保用户能够获得满意视频体验。