真实世界单图像超分辨率：新基准与新模型解析

需积分: 26 37 浏览量更新于2024-07-05 1 收藏 2.02MB DOCX 举报

“Toward Real-World Single Image Super-Resolution” 是一篇由阿里达摩院的研究者提出的关于超分辨率重建技术的论文，该论文提出了一种基于多尺度的退化核估计网络模型，并创建了首个真实超分辨率图像数据集，解决了传统方法依赖人工数据训练的问题，推动超分辨率技术向学习真实退化核的方向发展。本文讨论的核心知识点： 1. **单图像超分辨率(SISR)**：SISR是图像处理领域的一个关键任务，旨在从低分辨率图像中恢复高分辨率图像，以提高图像的细节和清晰度。它是一个高度不适定的逆问题，需要利用图像先验知识来解决。 2. **模拟数据集的局限性**：传统的SISR方法通常在使用双三次下采样等简单均匀退化的模拟数据集上训练模型。然而，真实世界中的图像退化过程更为复杂，导致这些模型在实际应用中表现不佳。 3. **真实超分辨率(RealSR)数据集**：阿里达摩院的研究者构建了一个新的数据集，通过调整数码相机的焦距获取高分辨率和低分辨率图像对，以模拟真实世界的退化过程。这个数据集能够更好地反映实际的图像退化情况。 4. **图像配准算法**：为了处理不同分辨率图像对的对齐问题，研究者开发了一种图像配准算法，确保LR-HR图像对的精确对应，为模型训练提供准确的数据基础。 5. **基于拉普拉斯金字塔的内核预测网络(LPKPN)**：针对RealSR数据集中的非均匀退化，研究者提出了一种新的网络模型LPKPN，它能够学习每个像素的退化内核，从而更有效地恢复高分辨率图像。 6. **模型泛化能力**：虽然RealSR数据集仅基于两台特定相机（佳能5D3和尼康D810）构建，但经过该数据集训练的模型能够很好地推广到其他相机设备，如索尼a7II和手机，展示了良好的跨设备泛化性能。 7. **深度学习与CNN在SISR中的应用**：随着深度学习，尤其是卷积神经网络的发展，SISR领域的模型设计和性能得到了显著提升。研究者通过设计新的CNN架构和损失函数，持续优化SISR模型的性能。 8. **挑战与未来方向**：尽管RealSR数据集和LPKPN模型是进步，但模型在应对各种未知的、复杂的退化模式时仍面临挑战。未来的研究可能会探索更通用的模型，以适应广泛的实际应用场景，并进一步提升真实世界图像的超分辨率效果。

在实验室环境中仅进行了两次尝试，其中使用复杂的设备在非常有限的场景中

收集图像对 [39, 26]。在这项工作中，我们的目标是使用灵活且易于复制的方法

构建更通用和实用的 RealSR 数据集。具体来说，我们使用不同焦距的固定数字

单镜头反光 (DSLR) 相机捕捉同一场景的图像。通过增加焦距，场景的更精细细

节可以自然地记录到相机传感器中。通过这种方式，可以收集不同尺度的 HR

和 LR 图像对。然而，除了视场（FoV）的变化外，调整焦距还会导致成像过程

中的许多其他变化，例如光学中心的偏移、缩放因子的变化、不同的曝光时间

和镜头畸变。因此，我们开发了一种有效的图像配准算法来逐步对齐图像对，

以便可以执行 SISR 模型的端到端训练。构建的 RealSR 数据集包含两台 DSLR 相

机（佳能 5D3 和尼康 D810）拍摄的各种室内外场景，为实际应用中 SISR 算法的

训练和评估提供了良好的基准。

与之前的模拟数据集相比，我们 RealSR 数据集中的图像退化过程要复杂得

多。特别是，退化在空间上是可变的，因为模糊内核随场景中内容的深度而变

化。也就是说同一张图上的退化核也是变化的，这促使我们为现实世界的 SISR

任务训练内核预测网络 (KPN)。核预测的思想是明确地学习每个像素的恢复核，

它已被用于去噪 [2, 34, 48]、动态去模糊 [43, 16] 和视频插值 [35, 36] 等应用中。

虽然有效，但 KPN 的内存和计算成本随内核大小成二次增加。为了获得与使用

大内核大小一样具有竞争力的 SISR 性能，同时实现高计算效率，我们提出了一

种基于拉普拉斯金字塔的 KPN (LP-KPN)，它为分解的图像金字塔学习每像素内

核。我们的 LP-KPN 可以使用小内核大小来利用丰富的信息，从而实现有效和高

效的现实世界 SISR 性能。图 1(e) 和 1(f) 分别显示了在我们的 RealSR 数据集上训

练的 RCAN [61] 和 LP-KPN 模型的 SISR 结果。可以看到，它们都比在模拟数据上

剩余18页未读，继续阅读

DZZ!!!!

粉丝: 52
资源: 6

真实世界单图像超分辨率：新基准与新模型解析

腾讯开源图像超分辨率算法RealSR源码以及预训练模型已经训练、测试的图片

Real-SR:通过内核估计和噪声注入实现真实世界的超分辨率

RealSR:通过内核估计和噪声注入实现真实世界的超分辨率

toward fast, flexible, and robust low-light image enhancement(cvpr2022)代码

toward fast, flexible, and robust low-light image enhancement

判断蛇移动的方向 if (toward == 0) { Snakex[0] = Snakex[0] - 20; } else if (toward == 1) { Snakex[0] = Snakex[0] + 20; } else if (toward == 2) { Snakey[0] = Snakey[0] - 20; } else if (toward == 3) { Snakey[0] = Snakey[0] + 20; }

时间敏感网络tsn经典书

计算机网络近三年参考文献

The Entity-Relationship Model-Toward a Unified View of Data

最新资源