深度学习驱动的图像彩色化技术探析

PDF格式 | 2.45MB | 更新于2024-06-17 | 164 浏览量 | 举报

"图像彩色化是一个关键的计算机图形学领域，旨在为单色图像添加颜色，以生成逼真的彩色效果。本文回顾了图像彩色化的历史，探讨了不同方法的发展，包括结合自然语言处理的创新以及深度学习，特别是生成对抗网络（GANs）的应用。彩色化方法主要分为三类：灰度图像着色、基于草图的着色和混合输入着色。随着技术的进步，研究人员现在能够提供更高的控制度，如参考图像和颜色涂鸦。深度学习的引入，尤其是GANs，极大地推动了该领域的进步，实现了更精细和真实的彩色化结果。" 图像彩色化的早期研究主要集中在基于规则的方法，这些方法依赖于人为定义的色彩传播规则，或者通过色彩共生矩阵来推断颜色。随着计算能力的增强，研究者开始探索基于学习的方法，这些方法可以从大量有标签的彩色图像中学习色彩分布和模式。基于草图的彩色化方法通常需要用户提供的草图作为输入，这些草图可以指导颜色的分配，使得结果更符合用户的期望。这种方法的优点在于用户参与度高，但缺点是用户需要有一定的绘画技能，并且过程可能较为耗时。混合输入彩色化则结合了多种类型的输入，如灰度图像和草图，以实现更灵活的颜色注入。这种方法可以结合图像的结构信息和用户提供的颜色指示，生成更加多样化的彩色结果。深度学习的引入，特别是生成对抗网络（GANs），为图像彩色化带来了革命性的变化。GANs通过训练两个神经网络——生成器和判别器，可以在无监督或弱监督的情况下学习到复杂的色彩分布。生成器尝试生成逼真的彩色图像，而判别器则试图区分真实彩色图像和生成的图像。这种对抗性学习过程使得生成的彩色图像具有更高的细节保真度和自然度。近年来，研究者还探索了将NLP（自然语言处理）与图像彩色化相结合，允许用户通过文本指令来控制图像的着色。这种方法可以实现更高级别的控制，比如根据描述文字来调整图像的整体色调或特定区域的颜色。尽管当前的深度学习方法在图像彩色化方面取得了显著的进步，但仍存在挑战，如处理动态视频的实时彩色化、保持色彩的一致性和准确性、以及减少模型对大量标注数据的依赖。未来的研究可能会集中在这些问题的解决上，以实现更高效、更准确和更个性化的图像彩色化技术。

S.- Y.

陈杰

张玉

-Y. Zhao

等人

视觉信息学

（

2022

）

图四、实例

感知图像着色的失败案例（Su et al. ，2020年）。

使用混合密度网络（MDN）来学习以灰度图像为条件最后，从

MDN中取出多个样本，并与VAE解码器相结合，以获得每个样本

的多个彩色化结果，从而提供丰富的彩色化结果集合。

基于颜色分布的分类模型和基于变分自编码器的生成模型虽然

可以得到多种彩色化方案，但彩色化结果缺乏空间结构的一致性

和用户对颜色的可控性。有时在同一个语义区域，彩色化结果中

会出现不同颜色的斑点。为了确保全局着色一致性和用户可控

性，

Messaoud

等人。（

2018

）提出了一种基于

VAE

的条件随机

场，并使用高斯条件马尔可夫随机场（G-CRF）来捕获全局图像

统计，对

VAE

解码器的输出空间和用户编辑信息的编码进行建模。

当图像彩色化方法直接应用于视频彩色化时，会出现不连续性Lei

和

Chen

（

2019

）提出了一种用于黑白视频的自动彩色化模型，无

需任何用户交互或参考图像。该方法设计了一个自正则化和多样

性损失函数，以实现灰度视频彩色化的一致性和多样性自正则化

损失主要由一个双边正则化项和一个时间正则化项组成Diversity

Loss

用于约束多个生成的结果，使其与真实彩色图像一致。虽然

该方法实现了多种彩色化结果的生成，但没有丰富的

不同结果之间的着色结果。

随着

Transformer

（

Vaswani et al.

，

2017

）在计算机视觉领

域，Kumar et al. （2020）提出了一种基于Transformer块的灰度

彩色化网络架构ColTran主要由一个自回归着色器，一个颜色上采

样器和空间上采样器组成

Autoregressive Colorizer

使颜色信息与

输入的低分辨率灰度图像匹配，然后颜色上采样器和空间上采样

器以完全并行的方式将低分辨率彩色图像采样为高分辨率图像。

该方法利用

Transformer

与单峰彩色化相比，多模态彩色化方法可以对给定的灰度输入

生成多种颜色结果。虽然这些自动方法不需要用户交互，但生成

的结果依赖于预先训练的网络模型。用户无法调整生成的结果，

例如整体着色风格或细节颜色，从而难以生成用户期望的结果

3.2.

基于颜色笔画的着色

为了解决自动方法无法控制细节颜色的问题，一些工作尝试采

用用户颜色笔划，并为用户控制提供直观的方法。

3.2.1.

优化着色

Levin等（2004）是彩色化领域最重要的先驱之一。在该方法

中，用户需要用颜色笔画标记灰度图像，以在

YUV

颜色空间中对

图像进行着色。然后，基于相邻像素具有相似的强度和它们的颜

色相似的规则，该方法将笔划的颜色扩散到整个图像。但是当不

同的物体颜色扩散并混合在一起时，Levin等人（2004）中存在渗

色问题为了解决这个问题，Huanget al. （2005）对加权函数进行

了改进，提出了一种自适应边缘检测算法，提高了边缘检测的准

确性。他们使用Sobel滤波器和迭代优化来改善边缘检测。此外，

着色方法将更准确，同时减少颜色溢出问题，并使图像颜色效果

更逼真。

先前的基于颜色笔画的着色方法，例如Levin方法（Levin et

al. ，2004年），通常需要大量的手动交互的复杂场景。为了减少

它，

Luan et al.

（

2007

）提出了一种新的交互式系统，可以快速

轻松地对灰度图像进行着色。该方法包括两个阶段，颜色标记阶

段和颜色映射阶段。颜色标记阶段通过约束所有像素的亮度平滑

度和纹理相似性来将标记的颜色扩散到相似区域。颜色映射阶段

根据涂鸦的亮度（

）和色度（

）值在亮度（

）空间建立分

段线性映射Levin等人（2004）和Luan等人（2007）之间的比较

如图5所示。可以看出，Luan et al.（2007）更快更有效。

对于单色电影，

Yatziv

和

Sapiro

（

2006

）使用固有的梯度权重以

及着色点与附近点之间的关系来在

YCbCr

颜色空间中着色。该方法

首先定义任意两点的固有（测地线）距离，以计算两点的亮度通道之

间的平滑度。然后对图像上的任意点，计算该点到已知色度点的最短

本征距离，找到与之对应的多个色度值，通过混合不同的色度值得到

最终的色度值。但这个过程涉及到需要大量的计算和复杂的过程来

保证色彩质量。

剩余18页未读，继续阅读

cpongm

粉丝: 6

深度学习驱动的图像彩色化技术探析

深度学习彩色化算法对曝光偏差图像着色研究.docx

Awesome-Image-Colorization:基于深度学习的图像着色和视频着色论文集

黑白图像彩色化技术：样本图片及处理流程解析

单波段热图像彩色化处理：基于色彩传递与伪彩色编码

MATLAB彩色图像分割实战：基于SVM与深度学习技术

RGB-D图像分类深度综述：技术发展与前景

从图像处理到图像生成：深度学习在图像处理的应用

彩色图像分割综述：方法、特点与前景

医学图像分割方法综述：挑战与进展

2005年后彩色图像灰度化算法综述：全球映射、局部映射与混合方法

最新资源