深度学习驱动的端到端图像压缩技术进展

119 浏览量更新于2024-08-27 1 收藏 10.42MB PDF 举报

"基于端到端学习的图像编码研究及进展" 本文主要探讨了在图像大数据时代背景下，随着硬件技术的快速发展，基于深度学习的图像视频编码技术的重要性和应用。端到端学习的图像压缩框架因其在原始图像数据压缩效率上的优势，受到了学术界和工业界的广泛关注。文章系统性地概述了这个领域的核心组成部分，包括变换、量化、熵编码和损失函数的研究现状，并对相关技术的最新进展进行了详细介绍。首先，图像压缩中的“变换”是将图像数据从空间域转换到频域的关键步骤，传统的图像压缩方法如JPEG使用离散余弦变换(DCT)。然而，基于深度学习的端到端方法可以自定义变换层，通过神经网络学习更适应数据特性的变换方式，从而提高压缩效率。其次，“量化”是图像压缩过程中的另一个重要环节，它将变换后的系数映射到有限的数值集合中。传统的量化过程可能导致信息丢失，而深度学习方法可以学习更精细的量化策略，减少失真并优化压缩性能。接着，熵编码是将量化后的数据进行高效编码的过程，如算术编码或哈夫曼编码。深度学习引入后，可以学习数据的概率分布，实现自适应的熵编码，进一步提升压缩比率。再者，损失函数的选择对压缩质量有直接影响。传统的MSE（均方误差）或PSNR（峰值信噪比）可能无法完全捕捉视觉感知质量，因此，研究者们探索了诸如MS-SSIM（多尺度结构相似度）、VGG损失等深度学习相关的损失函数，以更好地模拟人类视觉系统的感知特性。文章还对比分析了近期的一些前沿研究成果，如神经网络模型在压缩效率和重构质量方面的表现，以及不同方法在复杂性和解码速度上的权衡。这些研究不仅推动了理论上的进步，也为实际应用提供了更多可能性，例如在云计算、物联网(IoT)设备、高清视频流媒体等领域。基于端到端学习的图像编码已经成为图像压缩领域的一个重要研究方向。未来，这一技术有望在提高压缩效率、降低带宽需求的同时，保持高质量的图像重建，对于图像大数据的存储和传输具有重大意义。随着深度学习技术的不断发展，我们期待看到更多创新的图像压缩算法，以应对日益增长的图像数据处理挑战。

激光与光电子学进展

图



基于端到端学习的图像编码技术发展历程









 













󰁒󰁒







󰁒

















21

变



换

图像变换编码将空域图像像素转换为变换域系

数



实现能量聚集的紧致表达



以达到压缩的目的



大多数压缩方法都使用正交线性变换来降低数据的

相关性



在传统的变换方法中



最早针对信号冗余

解耦优化的线性变换可以追溯至



变换和主成分

分析法







之后国际图像编码标准



和



分别使用的离散余弦变换和小波变换也

均为线性变换



但是正交线性变换中线性滤波器响应的联合统

计量呈现了很强的高阶依赖性



为解决此问题可联

合局部非线性进行增益控制



近几年



端到端学习

将非线性变换融入图像压缩框架中



其中





等











提出了基于非线性变换编码的端到端学习框

架



图





将图像强度向量

先通过分析变换











其中

为学习参数向量



映射到编码域



再通过量化处理得到离散值向量



之后进行熵编

码





相对应地



由离散值向量

估计连续值向量





应用生成变换















其中

为学习参数向

量



并进行像素重建



编码决策通过率失真优化性

能



常见的失真度量包括均方误差







和





也可引入感知失真等进行性能优化



最后端到端学

习系统通过优化学习参数向量

和

来最小化码

率

和失真

的加权和



λD



其中



控制码率

和失真的平衡



分析变换分为三个阶段



卷积



下采

样和



变换



作为其逆变换的生成变换也分为

三个阶段



仿射卷积



上采样和



逆







变

换



且两类变换中的上下采样操作均可通过卷积来

实现



从而提高了计算效率



感知变换中归一化拉

普拉斯金字塔模型







与



的组合考虑了图

像局部亮度和对比度的误差



相较于采用



优

化



的传统方法而言



在相似重建质量的情况

下降低了码率



现今



自编码器被越来越广泛地用于图像压缩

中



这些研究利用单个自编码器或循环自编码器在

瓶颈层生成









用于后续的量化和熵编码









典型的自编码器结构包含三个部分



编码器



表示压

缩数据的瓶颈和解码器



将这三个部分级联并进行

端到端训练



由于传统



等算法中线性变换对

空间相关性和压缩数据分布的利用不够充分



使用

深度卷积神经网络可实现非线性变换



对图像分布

进行更好的冗余解耦



实现更紧致的特征表达并实

现更好的压缩











󰁒





󰁒

剩余10页未读，继续阅读

抹蜜茶

粉丝: 303
资源: 936

深度学习驱动的端到端图像压缩技术进展

基于深度学习的视频跟踪研究进展综述.pdf

基于深度学习的医学图像处理研究进展 (1).pdf

基于端到端的图像去模糊代码

写一篇关于端到端深度学习图像匹配的综述

基于深度学习的图像去噪方法研究综述 baiduxueshu

基于深度学习的图像处理算法研究

基于深度学习的图像压缩技术发展趋势

我想要基于rnn的图像标注算法的国内外研究现状

基于深度学习的图像检索优势

国内深度学习领域研究进展与热点分析——基于citespace与vosviewer的综合应用

最新资源