使用神经网络将黑白图像转为彩色图像的深度学习方法
需积分: 50 6 浏览量
更新于2024-09-10
收藏 1.67MB DOCX 举报
"Let there be Color!: Joint End-to-end Learning of Global and Local Image Priors" 是一篇关于将黑白图像转换为彩色图像的深度学习研究论文。该论文提出了一种联合学习全球和局部图像先验的端到端方法。
在论文中,作者利用大量现有的彩色图像数据来训练一个神经网络模型,旨在预测灰度图像在CIE Lab颜色空间中的色度(chrominance)。CIE Lab颜色空间是一种常见的颜色模型,它将颜色分为L(亮度)、a(绿红轴)和b(蓝黄轴)三个分量。论文的目标是在保持L值不变的情况下,通过预测a和b值,将灰度图像转化为具有真实感的彩色图像。
网络模型包括两个主要部分:普通卷积神经网络(CNN)和全卷积网络(FCN)。CNN部分用于提取图像的局部特征,而FCN部分则用于进行语义分割,以捕捉全局上下文信息。这种设计允许模型同时考虑图像的整体结构和局部细节,从而更准确地恢复色彩。
为了衡量模型的性能,论文采用均方误差(MSE)作为损失函数,即比较网络输出的彩色图像与原始彩色图像的缩放版本之间的差异,目标是使MSE最小化,以确保色彩还原的准确性。
在模型结构上,前六层卷积层是共享的,且没有使用池化层,以保留更多的空间信息。接着,通过四层卷积层和三层全连接层,提取出256维的全局图像特征向量。同时,通过两层卷积层得到表示中层特征的H/8×W/8×256的小长方体。最后,将全局特征与中层特征通过简单的拼接操作融合,形成一个更大的特征向量,用于生成最终的彩色图像。
论文的重点在于如何有效地结合全局信息和局部信息,以防止出现错误的色彩分配,如将室内物体错误着色为天空或草地的颜色。通过共享低维特征和不同层次的特征融合,模型能够更好地理解和恢复图像的色彩结构。
总结来说,这篇论文介绍了一种创新的方法,利用深度学习技术将黑白图像转换为逼真的彩色图像,强调了全局和局部信息在这一过程中的重要性,并提供了一个有效的端到端学习框架。通过实验和结果分析,这种方法展示了在图像着色任务上的优越性能。
110 浏览量
339 浏览量
115 浏览量
2021-03-17 上传
147 浏览量
2021-02-07 上传
309 浏览量
268 浏览量
224 浏览量
爱视觉
- 粉丝: 5
- 资源: 2
最新资源
- 100课AE系统教程,让你的视频玩转特效功能41-80.rar
- b7a-community-call-samples
- tinykv:基于TiKV模型构建分布式键值服务的课程
- 经典企业电脑模板
- 行业-强化练习-言语3+乌米+(讲义+笔记).rar
- libwdi:USB 设备的 Windows 驱动程序安装程序库-开源
- jQuery版本
- RBAP-Wiki:这是Roblox游戏的官方维基,称为“随机建筑和零件”。
- 字模提取软件合集有问题可以问我
- alien-filter
- pyslam:pySLAM在Python中包含一个单眼视觉Odometry(VO)管道。 它支持基于深度学习的许多现代本地功能
- SpringBoot之rpm打包文档.rar
- 距离标度:一种改进基于密度聚类的距离标度方法-matlab开发
- yarl:另一个URL库
- 信息系统项目管理师论文真题范文汇总.zip
- ICLR 2021上关于【NLP】主题的论文