深度双边学习在实时图像增强中的应用研究

版权申诉

5星 · 超过95%的资源 161 浏览量更新于2024-09-08 收藏 1.5MB DOCX 举报

"这篇文档是关于‘Deep Bilateral Learning for Real-Time Image Enhancement’的文献调研，探讨了如何利用深度学习和双边网格处理技术实现实时图像增强。文章介绍了一个新型的神经网络架构，该架构结合了局部仿射颜色变换，以高效地提升图像的视觉效果。" 深度学习在图像处理中的应用已经成为现代计算机视觉领域的主流方法，特别是在实时图像增强方面。本文重点研究的“Deep Bilateral Learning”技术是将传统的双边滤波器与深度学习相结合的一种创新方式。双边滤波器因其对边缘保持的能力而在图像处理中广泛应用，而深度学习则能学习到复杂的图像特征并进行高效处理。论文《Deep Bilateral Learning for Real-Time Image Enhancement》（2017年SIGGRAPH会议发表）提出了一个新模型，该模型通过成对的输入/输出图像训练卷积神经网络（CNN），以预测双边空间中局部仿射模型的系数。模型设计的关键在于，它能够学习到局部、全局以及内容相关的决策，以执行所需的图像转换。在运行时，模型使用低分辨率图像输入，生成一组仿射变换，随后在双边空间中进行上采样并应用到全分辨率图像上，确保边缘细节得以保留。具体来说，该方法包括以下几个步骤： 1. 图像下采样：首先，将图像降低分辨率，以减少计算量。 2. 特征学习：通过卷积层分别提取局部和全局特征。 3. 双边网格与仿射变换：将学到的特征结合，转换到双边空间，并计算仿射变换系数。 4. 引导图生成：通过特定的网络结构（如ccm/tone curve和卷积）生成引导图，用于指导上采样的过程。 5. slice操作：根据像素位置和引导图，应用加权3DLUT（三维查找表）获取每个像素的最终变换参数。 6. 仿射变换应用：将这些变换应用到原始图像上，生成增强后的图像。训练过程中，模型使用大量的数据进行离线训练，以便学习到复杂的场景依赖转换，即使没有参考实现也能达到类似专业摄影师的编辑效果。这种离线训练使得模型能够适应各种图像增强任务，且在运行时无需访问原始操作，极大地提高了处理速度。该文献提出的深度双边学习模型成功地将深度学习的效率和双边滤波器的边缘保真性结合起来，实现了在智能手机等设备上对高分辨率图像的实时增强，且达到了与现有最佳技术相当的质量。这种方法对于移动设备上的图像处理具有重要的实用价值，尤其是在实时视频和增强现实应用中。

机器学习调研报告

提高对比度

论文

1. 论文（包括期刊和发表时间）：

Deep Bilateral Learning for Real-Time Image

Enhancement（2017 siggraph）

2. 论文链接：

hps://dl.acm.org/doi/10.1145/3072959. 3073592

3. 源代码链接：

https://github.com/google/hdrnet

4. 主要 idea：

本文提出了一种新的神经网络结构的灵感来自双边网格处理和

局部仿射颜色变换。利用成对的输入/输出图像，作者训练一个卷积

神经网络来预测双边空间中局部仿射模型的系数。其体系结构学习

做出局部、全局和内容相关的决策，以近似地进行所需的图像转换。

在运行时，神经网络消耗输入图像的一个低分辨率版本，在双边空

间产生一组仿射变换，使用一个新的切片节点以一种保持边缘的方

式对这些变换进行上采样，然后将这些上采样变换应用于全分辨率

图像。算法在毫秒内处理智能手机上的高分辨率图像，提供 1080p

分辨率的实时取景器，并与大量图像操作符的最新近似技术的质量

下载后可阅读完整内容，剩余6页未读，立即下载

HenrySmale

粉丝: 1w+

深度双边学习在实时图像增强中的应用研究

Python-深入双边学习实时图像增强

Real-Time O(1) Bilateral Filtering

Real-Time+Specular+Highlight+Removal+Using+Bilateral+Filtering.pdf

给我推荐20个比流行的多模态模型

EAST和DBNet算法有什么区别

Camera ISP

事件图像low-level

中文opencv blur

最新资源