深度学习驱动的全自动图像着色网络：基于SE-Inception-ResNet-v2

97 浏览量更新于2024-08-31 5 收藏 523KB PDF 举报

"基于卷积神经网络的图像着色技术是一种利用深度学习和卷积神经网络（CNN）为灰度图像添加色彩的方法。本文主要介绍了一种以U-Net为基础的全自动图像着色网络模型，其中结合了SE-Inception-ResNet-v2结构用于高级特征提取，并采用PoLU激活函数代替传统的ReLU。实验表明，该模型能有效地对灰度图像进行着色。" 本文探讨了图像着色的挑战和进展，特别是在深度学习时代。图像着色是一个复杂的问题，旨在为无色图像赋予色彩。传统方法可分为局部颜色扩展和颜色传递两类。前者依赖于用户指定颜色并处理全局优化，需要大量手动工作；后者则依靠参考图像传递颜色信息，限制了颜色多样性。然而，随着深度学习的崛起，数据驱动的彩色化方法逐渐成为主流。文章提到了几种深度学习着色方法，如使用图像描述符的深度神经网络、基于全局和中层特征的着色模型以及多模态的像素颜色预测方案。这些方法展示了深度学习在图像着色中的潜力，能够自动生成多种风格的彩色图像。作者提出了一种创新的网络架构，以U-Net为核心，结合了SE-Inception-ResNet-v2。SE-Inception-ResNet-v2是一种深度卷积神经网络，它在Inception模块和ResNet残差连接的基础上，整合了SENet（Squeeze-and-Excitation Network）模块。SENet通过学习特征通道之间的相互依赖，可以增强重要特征并抑制无关特征，提高了模型的表示能力。此外，文中还引入了PoLU（Power Linear Unit）激活函数，以替代常见的ReLU，这可能有助于网络在特征学习过程中的表现。实验结果显示，所提出的网络模型在自动为灰度图像着色方面表现出色，能够有效地恢复图像的色彩信息。这表明，结合深度学习和精心设计的网络结构，可以实现高质量的图像着色，减少对用户交互的依赖，同时也拓宽了在图像处理领域的应用可能性。未来的研究可能继续探索如何进一步提升着色的自然度和真实感，以及如何适应更多样化的图像内容和风格。

基于卷积神经网络的图像着色基于卷积神经网络的图像着色

图像着色的目标是为灰度图像的每一个像素分配颜色，它是图像处理领域的热点问题。以U-Net为主线网络，结

合深度学习和卷积神经网络设计了一个全自动的着色网络模型。在该模型中，支线使用卷积神经网络SE-

Inception-ResNet-v2作为高水平的特征提取器，提取图像的全局信息，同时在网络中使用PoLU(Power Linear

Unit)函数替代线性整流函数(ReLU)。实验结果证明此着色网络模型能够对灰度图像进行有效的着色。

0 引言引言

图像着色是灰度图像伪彩色化的过程，具有很高的研究和应用价值。早期图像着色方法主要分为两类：一类是基于局部颜

色扩展

[1]

，另一类是基于颜色传递

[2]

。前者需要用户指定整张图片的颜色，要求用户解决全局优化问题，并在目标图像上标注

一定数量的彩色笔刷作为着色的依据，再进行颜色扩展完成对整幅图像的着色。这类方法可以得到一些较好的彩色图像，但是

需要处理复杂的纹理和大量的人为干涉，不同的颜色区域要求用彩色笔刷显式地标记为不同颜色。因此在整个着色过程中，用

户的工作量很大且着色效果高度依赖其艺术技巧。后者在图像着色过程中消除了人为因素的干预和影响，与前者不同的是，这

类方法需要一幅彩色图像作为参考图像，用以传递颜色信息。应用此类方法得到的图像颜色与参考图像类似，因此在结果上减

少了颜色种类的数量，而且要找到一个合适的示例图片需要花费很长时间。随着深度学习的发展及运用，深度神经网络的数据

驱动彩色化方法已经成为一种趋势[3]。例如，CHENG Z等

[3]

采用图像描述符作为输入的深度神经网络图像着色方法，使用神

经网络提取图像特征。IIZUKA S等

[4]

使用一种基于全局层次特征和中层特征的理论对黑白图像进行编码然后着色，将两部分

特征融合再预测像素的颜色信息，并且网络还可以对图像分类。ZHANG R等

[5]

使用了多模态的方案，每个像素都给出了可能

出现颜色的概率值，因此着色后会出现几种不同颜色风格的图像。

受以上工作的启发，本文结合深度神经网络Inception-ResNet-v2

[6]

设计了一个全自动的着色网络模型，在模型中加入

了SENet模块

[7]

，SENet可以显式地对特征通道之间的相互依赖关系进行建模，通过学习的方式来自动获取到每个特征通道的

重要程度，然后依照重要程度增强有用特征，并且抑制对当前任务无用的特征。Inception-ResNet-v2与SENet结合作为一个高

水平的特征提取器，同时使用PoLU函数

[8]

替代线性整流函数(Rectified Linear Unit, ReLU)函数，提高网络性能。

1 模型与算法模型与算法

1.1 理论方法理论方法

式中，n为权值，在负数部分控制着PoLU函数变化率。PoLU函数有非零输出用于负输入，这不仅增加了学习的稳定性和表示

能力，而且能使单位输出的均值接近于零，从而减少了偏置移位效应。与以前的激活函数不同，当n>1时，PoLU函数在其负

状态下与y=x有交点，它能增大响应区域。为了更好地训练网络，找到模型最优参数，同时量化模型损失，在颜色空间中采用

估计像素颜色值和它们真实值之间的均方误差(MSE)，然后通过网络反向传播该损失，用以更新模型参数达到最佳。对于一张

图片P，表示目标和重建图像的第X个分量的第ij像素值，公式如下:

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38681719

粉丝: 8
资源: 930

深度学习驱动的全自动图像着色网络：基于SE-Inception-ResNet-v2

图像着色算法的实现（MFC编程）

使用GAN进行图像着色：具有生成对抗网络的灰度图像着色

神经网络着色器

基于卷积神经网络的图像着色.pdf

基于卷积神经网络的黑白人物图像实时着色方法研究.pdf

基于卷积神经网络的图像着色模型的推广

基于卷积神经网络的黑白人物图像多种合理着色的研究.pdf

基于卷积神经网络的图像编辑传播.pdf

基于深度卷积神经网络（CNN）模型的图像着色研究与应用系统实现

基于积神经网络的图像着色方法研究.pdf

最新资源