视频缩放新突破：联合优化的MIMO-VRN与LSTM-VRN网络

需积分: 7 80 浏览量更新于2024-07-09 收藏 1.48MB DOCX 举报

"MIMO_VRN视频缩放论文完整翻译.docx" 本文主要探讨了视频缩放技术，尤其是视频重新缩放的任务，该任务旨在调整视频的空间分辨率，以适应不同观看设备的需求。当前大多数研究专注于基于图像的解决方案，忽略了时间信息在视频处理中的重要性。为此，论文提出了两种基于可逆神经网络且具有耦合层的联合优化方法，分别是LSTM-VRN（长短期记忆视频重新缩放网络）和MIMO-VRN（多输入多输出视频重新缩放网络）。 LSTM-VRN利用长短期记忆单元来捕获低分辨率视频的时间信息，对丢失的高频细节进行预测和恢复，特别是在视频放大过程中。这种设计使得模型能够利用时间序列中的连续性来提高升尺度的质量。 MIMO-VRN则采用一种创新策略，能够同时处理一组视频帧的缩小和放大。这种方法考虑了帧间的相互依赖，从而在整体上提升缩放效果。与仅关注单个图像的可逆模型相比，这两种方法在量化和定性评估中都表现出优越的性能，且相对于未进行联合优化的视频缩放技术，它们能显著提高缩放质量。引言部分指出，随着高清视频拍摄设备的普及，大量的高分辨率视频被生成并需要进行尺寸调整。视频缩放不仅涉及缩小以节省存储和传输资源，还涉及到放大以适应不同分辨率的显示设备。然而，传统的预定义内核缩放方法（如双三次内核）会导致高频信息丢失，使得从低分辨率到高分辨率的恢复变得困难。而MIMO-VRN和LSTM-VRN的联合优化策略则弥补了这一不足，通过优化整个缩放过程，减少了由降尺度操作导致的信息损失。论文的贡献在于首次尝试对视频的降尺度和升尺度进行联合优化，提出了利用时序信息的神经网络架构，以提高视频缩放的视觉质量和HR重建质量。通过与传统方法的对比，验证了这些方法的有效性和优势，为视频处理领域提供了一种新的、更为全面的解决方案。

训练目标通常要求 LR 图像也适合人类感知。最近，IRN [29] 为这

个联合优化任务引入了一个可逆模型 [4, 5, 13]。它能够通过以互惠

方式配置的同一组神经网络执行图像缩小和放大。它提供了一种方

法来明确建模由于高斯噪声缩小而丢失的高频信息。

（三）可逆重缩放网络

IRN [29] 是一种可逆模型，专为图像缩放而设计。 IRN 的前向

模型包括一个二维 Haar 变换和八个耦合层 [4, 5, 13]，如图 3 所示。

通过应用二维 Haar 变换，输入图像 x R∈

C×H×W

首先分解为一个低频

段 y’ R∈

C× H/2 × W/2

和三个其他高频段 z’ R∈

3C× H/2 × W/2

。这两个分量

y’、z’ 随后通过耦合层进行处理，输出 y 变成视觉效果较好的 LR 图

像，z 编码输入 HR 图像 x 中固有的互补高频信息。理论上，反耦

合层可以从 y 和 z 无损地恢复 x，因为该模型是可逆的。在实践中，

z 在推理时不可用于放大。 IRN 的训练要求 z 遵循高斯分布，以便

在推理时，可以绘制高斯样本 zˆ 作为缺失的高频分量的替代品。尽

管 IRN 在图像重新缩放任务上取得了优异的结果，但它对于视频重

新缩放并不是最佳选择。本质上，IRN 是一种基于图像的方法。这

项工作首次尝试使用可逆耦合架构联合优化视频缩小和放大（图

3）。

剩余27页未读，继续阅读

DZZ!!!!

粉丝: 52
资源: 6

视频缩放新突破：联合优化的MIMO-VRN与LSTM-VRN网络

Massive MIMO_mimo_massiveMIMO_源码.zip

block_mimo_ ofdm_channelestimation.tar.zip

MIMO_OFDM卷积码

MIMO_OFDM技术

MIMO_OFDM技术意义

mimo_ofdm-wireless-communication

MIMO系统的信道模型

基于matlab空时分组编码mimo_ofdm通信系统仿真

mimo_ofdm-wireless-communication with matlabpdf

最新资源