高清视频帧预测：SDC-Net利用空间位移卷积提升细节

59 浏览量更新于2024-06-20 收藏 2.07MB PDF 举报

本文主要探讨了一种创新的视频帧预测技术，名为"基于空间位移卷积的高清视频帧预测方法" (SDC-Net)，该方法旨在提高视频帧预测的清晰度和细节保留能力，特别是在高分辨率场景下。传统的视频帧预测技术面临着挑战，如仅依赖未来光流的重采样可能导致遮挡区域处理不力，生成模型则往往产生模糊效果，且内核大小增加会增加内存需求。 SDC-Net的核心贡献在于引入了空间位移卷积 (SDC) 模块。这种方法摒弃了单纯依赖未来光流的策略，而是学习每个像素的运动矢量，并根据这些预测的矢量确定在源图像中的正确位移位置，然后通过在该位置应用预先学习的内核来合成新像素。这种融合了向量导向和内核生成的优点的方式，既捕捉了对象的运动细节，又保持了周围结构的真实呈现，解决了先前方法的局限性。研究者们在一个包含428K个未标记的1080p游戏视频帧的数据集上训练了模型，验证了其在高清视频预测任务上的优越性能。在YouTube-8M数据集上，SDC-Net达到了0.904的 Structural Similarity Index Measure (SSIM) 分数，显示出对复杂场景的出色适应性。在加州理工学院行人视频上，模型的表现进一步提升，SSIM分数达到了0.918，这证明了其在处理大运动和生成清晰、连贯帧方面的高效能力。关键词：3D卷积神经网络 (3DCNN)、采样核、光流、帧预测。这项工作展示了在视频预测领域的进步，尤其是在对高清视觉质量的追求上，为未来的实时视频处理和增强现实应用提供了强大的技术支持。通过在大规模未标记数据上进行训练，SDC-Net展示了在无监督学习环境下取得的显著成果，这为未来的视频处理技术发展开辟了新的可能性。

F.A. Reda等人

（u，

v）

（x

，

y）

（x，y）

（x+u，

y+v）

（u

，

v）

（x，y）

（

，

）

（（

x+ u

，

y+v

））

（

，

）

（x

，

y）

（

，

）

（

，

）

（x

，

y）

（

x+u

，

y+v

）

(a)

基于向量

（

）基于内核（

）基于

SDC-based

图二、基于采样的像素合成插图。（a）具有双线性内插的基于向量的

（b）基于核的，具有中心补丁的卷积（c）我们的基于SDC的方法，与位

移贴片的卷积。

其中K（x

，

y）∈R

是G在（x

，

y）处预测的N×N二维核，

（x

，

y）

是I

中以（x

，

y）为中心的N×N片。我们将这种方法称为自适应基于内

核的重采样[24，23]。图3b示出了这种方法。

由于等式（2）在合成中考虑了很少的像素，因此其结果经常因斑

点噪声图案而劣化。但是，它可以模拟大位移，而不会显著增加参数

计数。另一方面，方程式

(3)对于小位移产生视觉上令人满意的结果，但是需要在每个位置预测

大的内核以捕获大的运动。因此，基于内核的方法很容易变得不仅推

理成本高，而且难以训练。

2.1

空间位移卷积

为了实现两全其美，我们提出了一种混合解决方案SDC使用运动矢量

（

，

）和自适应内核K（

，

）两者的预测，但是将预测的内核与

在I

中的移位位置（

，

）处的补丁卷积。使用SDC的像素合成

被计算为：

（

，

）

K（

，

）

（

，

）

（四）

因此，预测像素I

（x

，

y）是以I

中的（x+

，

+v）为中心的

N×N区域中的像素的加权采样。斑块

（x +

，

+ v）

在非整数坐

标处双线性采样。图图3c示出了我们的基于SDC的方法。

将

（

，

）设置为除了中心处的1之外的全零核将SDC简化为等式（2），

而将

和

设置为零将其简化为等式（3）。然而，重要的是要注

意，SDC与连续应用等式（2）和等式（3）不同如果连续应用，则

由K（x

，

y）采样的N×N斑块将受到方程的再散射效应

(2)而不是I

的原始补丁。

我们的SDC有效地解耦了位移和内核学习，使我们能够实现基于

内核的方法的视觉上令人愉快的结果，同时保持内核大小小。我们还

对K（

，

）采用可分离核[24]以进一步降低计算成本。在每个位置

处，我们预测一对1D内核，并且

（x+u，

y+v）

（u

，

v）

（x

，

y）

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

高清视频帧预测：SDC-Net利用空间位移卷积提升细节

HEVC帧内预测

基于深度卷积长短时神经网络的视频帧预测.pdf

基于可变形卷积的单帧图像眼球定位追踪

基于一维卷积神经网络预测

基于卷积神经网络风电功率预测

conv3d视频预测

基于FPGA的卷积网络图像识别

基于卷积神经网络的股票趋势预测所用到的方法有哪些

基于dsp的卷积算法设计

基于FPGA的卷积神经网络

最新资源