深度视频质量评估：时空视敏度的卷积神经聚合网络分析

63 浏览量更新于2024-06-20 收藏 2.07MB PDF 举报

"本文介绍了一种名为深度视频质量评估器(DeepVQA)的新方法，该方法结合了时空视敏度和卷积神经聚合网络(CNAN)，用于精确预测视频的质量感知。DeepVQA旨在模拟人类视觉系统(HVS)的工作原理，特别是考虑到时间和空间因素在感知质量中的影响。通过卷积神经网络(CNN)和CNAN，模型能够识别并量化视频中的时空敏感性，同时利用注意力模型处理时间变化的失真。在LIVE和CSIQ视频数据库的测试中，DeepVQA的表现优于传统方法，相关系数提高了1.5%以上，预测精度提升超过100%。" 深度视频质量评估器(DeepVQA)是针对视频质量评估(VQA)领域的一个创新解决方案，它着重解决如何将时空感知融入到VQA算法中的问题。传统的统计和计算模型在处理时空感知时存在局限性，而DeepVQA通过引入深度学习技术，尤其是CNN和CNAN，克服了这些局限。CNN被用来捕捉视频中的空间特征，而CNAN则进一步整合了时间维度的信息，形成时空敏感性的量化评估。文章指出，人类视觉系统在观看视频时，不仅考虑空间特性，还对时间变化非常敏感。例如，某些局部失真可能会因为运动或者相邻帧的差异而被强化或掩盖。因此，DeepVQA通过学习过程，可以生成预测的时空敏感图，这有助于识别哪些区域的失真会影响观看者的感知质量。此外，为了解决失真随时间变化的问题，DeepVQA提出了一种时间池方法，它采用注意力模型来处理不同时间点的失真影响。这种方法有助于更准确地估计由于网络条件不稳定导致的视频质量波动。在实验部分，DeepVQA在LIVE和CSIQ这两个常用的视频质量评估数据库上展示了卓越的性能。与现有方法相比，DeepVQA的相关系数提高了1.5%，并且在预测精度上取得了超过100%的提升。这些结果表明，DeepVQA能够更有效地模拟人类对于视频质量的感知，从而在视频流服务中提供更准确的质量预估，助力提供更优质的用户体验。关键词涵盖了视频质量评估、视觉敏感度、卷积神经网络、注意力机制、人类视觉系统以及时间池等核心概念，强调了DeepVQA在理解和模拟人类观看视频时的感知质量方面所做的贡献。这项工作对于优化视频编码、传输和流媒体服务具有重要意义，特别是在网络条件不稳定的环境中，确保用户能够获得满意视频体验。

W. Kim等人

图2：时间质量变化及其对质量判断的影响的示例

相关作品

2.1

时空视敏度

许多VQA模型已被开发的人类视觉灵敏度。从这些工作中，掩蔽效

应已经由空间

分布函数

（

CSF

）

解释

[

- 18]

。

由于

类似于带通滤波器的时

间点CSF，人类对具有非常低或高频率的信号不敏感。因此，如果存

在强对比度或运动，则根据掩蔽效应[4，19，20]，失真不太明显基于

这些观察，已经开发了各种VQA方法。Saad

等人。

[7]使用运动相干

性和自我运动作为影响时间掩蔽的特征。Mittal

等人

[21]介绍了自然

视频统计（NVS）理论，该理论基于像素分布会影响视觉灵敏度的实

验结果然而，有一个限制，反映复杂的行为的人类视觉系统的视觉敏

感度模型，这些先验知识。因此，我们设计了一个基于学习的模型，

学习人类的视觉灵敏度自主的视觉线索，影响人类视觉系统。

最近，已经尝试通过在I/VQA中使用深度学习来学习视觉灵敏度

[3，22，23]。然而，他们在提取质量特征时没有考虑运动特性。因

此，在预测大运动方差的影响方面仍然存在局限性。

2.2

时间池

在VQA领域中已经研究了时间质量池化方法如前所述，取平均值的简

单策略已在许多

VQA算法

中采用

[

- 26]

。

其他研究已经分析了所

述计

算结果

，

并

从HVS的角度自适应地汇集了时间分数[12]。然而，由

于这些朴素的池化策略仅利用有限的时间特征，因此难以推广到实际

视频。

最近，注意力机制已经在机器学习领域中被开发[13，15]。神经

网络中的注意机制是基于HVS中的视觉注意基于注意力的方法本

质上允许模型聚焦于特定区域并在时间轴上调整焦点受此启发，

有一项研究通过注意力特征嵌入来解决时间池[14]。然而，由于它

自适应地将权重向量嵌入到每个独立的分数特征向量，因此难以

有效地利用该方案来进行计算。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度视频质量评估：时空视敏度的卷积神经聚合网络分析

深度学习在图像分类中的应用：构建您的第一个卷积神经网络（CNN）.md

基于卷积神经网络的时空融合的无参考视频质量评价方法.pdf

华泰人工智能系列之十五：人工智能选股之卷积神经网络-20190213-华泰证券-21页.pdf

深度可分离卷积神经网络相比卷积神经网络的优点

卷积神经网络和神经网络区别

目前最先进的卷积神经网络

tf2.0深度学习实战(三):搭建lenet-5卷积神经网络

卷积神经网络算法的优缺点以及关于卷积神经网络算法的思考

深度卷积神经网络属于卷积神经网络吗

图像分类问题可以用什么卷积神经网络

最新资源