没有合适的资源?快使用搜索试试~ 我知道了~
首页SRCNN单幅图像超分辨率翻译
资源详情
资源评论
资源推荐

深度卷积网络图像超分辨率的研究
摘要:本文提出了一种单幅图像超分辨率的深度学习方法(SR)。本方法直接学习低 /
高分辨率图像之间的端到端映射。该映射表示为深度卷积神经网络(CNN)[15],它将低分
辨率图像作为输入并输出高分辨率图像。进一步表明,传统基于稀疏编码的 SR 方法也可以
被看作是一个深度卷积网络。但不同于传统分别处理每个部分的方法,本方法共同优化所有
层。本文深度 CNN 结构轻巧,却展现了最先进的修复质量,实现了实用在线使用速度。
关键词:超分辨 深度卷积神经网络
一、介绍
单幅图像超分辨率(SR)[11]是计算机视觉中的一个经典问题。最近用于单幅图像超分
辨率的最先进方法大多是基于实例的。这些方法要么利用相同图像的内部相似性[7,10,23],
要么从外部低分辨率样本对和高分辨率样本对学习映射函数[2,4,9,13,20,24,26,28]。基于示例
的外部方法往往提供了丰富的样本,但是受到数据有效和紧凑建模困难的挑战。
基于稀疏编码方法[25,26]是外部基于实例的图像超分辨率代表方法之一。这个方法涉及
到几个步骤。首先,从图像中密集地提取重叠的片并进行预处理(例如,减去平均值)。然
后这些图片由低分辨率字典编码。稀疏系数被传递到高分辨率字典中,用于重建高分辨率的
图片。重叠重建图片被聚合(或平均)以产生输出。之前的 SR 方法特别注意学习和优化词
典[25,26]或者对其进行建模的替代方法[4,2]。然而,管道中的其余步骤很少被优化或考虑在
统一的优化框架中。
在本文中,我们展示了上述管道相当于一个深层卷积神经网络[15](更多细节在 3.2
节)。 受此事实的启发,我们直接考虑卷积神经网络,它是低分辨率图像和高分辨率图像
之间的端到端映射。我们的方法与现有的基于外部例子的方法有着根本的不同,因为我们没
有明确地学习字典[20,25,26]或流形[2,4]来模拟图像块空间。这些通过隐藏层隐式实现。此外,
图像块提取和聚合也被制定为卷积层,因此涉及优化。在我们的方法中,整个 SR 管道是通
过学习完全获得的,很少有前/后处理。
我们命名提出的模型超分辨率卷积神经网络(SRCNN)。拟议的 SRCNN 有几个吸引
人的属性。首先,它的结构是为了简单而设计的,与现有的基于实例的方法相比,它提供了
更高的精度。图 1 显示了一个例子的比较。其次,在中等数量的过滤器和层数下,我们的方
法即使在 CPU 上也能实现快速的实际在线使用。我们的方法比一系列基于范例的方法更快,
因为它是完全前馈的,不需要解决任何使用上的优化问题。第三,实验表明,当(i)更大

的数据集可用,和/或(ii)使用更大的模型时,网络的恢复质量可以进一步提高。相反,较
大的数据集/模型可能会对现有的基于示例的方法提出挑战。
图一 超分辨率卷积神经网络(SRCNN)仅用少量的训练迭代即可超越双三次基线,并
且在中等训练的情况下优于基于稀疏编码的方法(SC)[26]。性能可以通过更多训练迭代得
到进一步改善。更多细节在第 4.1 节中提供(Set5 数据集的放大系数为 3)。所提出的方法
从低分辨率图像提供视觉上吸引人的重建。
总的来说,这项工作的贡献主要有三个方面:
1.我们提出了一个卷积神经网络的图像超分辨率。网络直接学习低分辨率图像和高分辨
率图像之间的端到端映射,在优化之外几乎没有预处理/后处理。
2.我们建立了基于深度学习的 SR 方法和传统的基于稀疏编码的 SR 方法之间的关系。这
种关系为网络结构的设计提供了指导。
3.我们证明,深度学习在超分辨率的经典计算机视觉问题中是有用的,并且可以实现良
好的质量和速度。

二、相关工作
图像超分辨率。一种最先进的 SR 方法[9,4,25,26,24,2,28,20]学习低/高分辨率片之间的映
射。这些研究在如何学习一个紧凑的字典或流形空间来关联低分辨率/高分辨率的图像块以
及如何在这样的空间中进行表示方案方面有所不同。在 Freeman 等人的先驱工作中。[8],字
典直接表示为低/高分辨率的片对,并且在低分辨率空间中找到输入片的最近邻(NN),其
相应的高分辨率片用于重构。Chang 等人 [4]引入了一种流形嵌入技术作为神经网络策略的
替代方案。在杨等人的工作[25,26]中,上述 NN 对应推进到更复杂的稀疏编码公式。这种基
于稀疏编码的方法及其一些改进[24,20]是现今最先进的 SR 方法之一。在这些方法中,图像
块是优化的重点; 修补程序提取和聚合步骤被视为前/后处理和分开处理。
卷积神经网络。卷积神经网络(CNN)可以追溯到几十年[15],最近显示出爆炸性的流
行,部分原因是它在图像分类方面的成功[14]。在这个过程中,有几个因素至关重要:
(1)在现代强大的图形处理器上实现高效的训练[14];( 2)整合线性单元(ReLU)的建
议[18],使得收敛速度更快,质量[14],和(3)容易获得丰富的数据(如 ImageNet [5])来
训练更大的模型。我们的方法也从这些进展中受益。
深度学习图像恢复。已经有一些使用深度学习技术进行图像恢复的研究。多层感知器
(MLP)的所有层都是完全连接的(与卷积相反),被应用于自然图像去噪[3]和后去模糊
去噪[19]。卷积神经网络与我们的工作更密切相关,被应用于自然图像去噪[12]和去除噪声
模式(污垢/雨)[6]。这些恢复问题或多或少是由去噪驱动的。相反,图像超分辨率问题并
没有见识到深度学习技术的运用。
三、卷积神经网络的超分辨率
3. 1 公式
考虑一幅单一的低分辨率图像。首先,使用双三次插值将其升级到所需的大小,这是我
们执行的唯一预处理。将插值后的图像表示为 。我们的目标是从 中恢复出与真实高分
辨率图像 尽可能相似的图像 。为了便于表示,我们仍然称 为“低分辨率“图像,虽
然它与 的尺寸相同。我们希望学习一个映射 ,它在概念上由三个操作组成:

1.图像块提取和表示:该操作从低分辨率图像 中提取(重叠)图像块,并将每个图像
块表示为高维向量。这些向量包括一组特征映射,其数目等于向量的维数。
2.非线性映射:该操作非线性地将每个高维矢量映射到另一个高维矢量上。每个映射矢
量在概念上是高分辨率图像块的表示。这些向量包含另一组特征映射。
3.重建:该操作将上述高分辨率的面片表示法聚合,以生成最终的高分辨率图像。预期
该图像与原图 相似。
我们将展示所有这些操作形成一个卷积神经网络。图二描述了网络的概况。接下来我们
详细介绍我们对每个操作的定义。
图像块提取和表示。图像恢复中的一个流行的策略(例如,[1])是密集地提取斑块,
然后用一组预先训练的基础来表示它们,例如 PCA,DCT,Haar 等等。这相当于将图像卷
积过滤器,每个都是基础。在本文表述中,将这些基础的优化纳入网络的优化。形式上,我
们的第一层被表示为一个操作 :
(1)
其中 和 分别表示滤波器和偏差。 大小为 ,其中 是输入图像中
的通道数, 是滤波器的空间大小, 是过滤器的数量。直观地说, 在图像上应用
卷积,并且每个卷积具有核大小 。输出由 个特征映射组成。 是一个
维向量,其每个元素都与一个过滤器相关联。我们在滤波器响应上应用了整数线性单元
ReLU, [18] 。
剩余16页未读,继续阅读
















IPNUSITlegal
- 粉丝: 1
- 资源: 2
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
最新资源
- ARM Cortex-A(armV7)编程手册V4.0.pdf
- ABB机器人保养总结解析.ppt
- 【超详细图解】菜鸡如何理解双向链表的python代码实现
- 常用网络命令的使用 ipconfig ping ARP FTP Netstat Route Tftp Tracert Telnet nslookup
- 基于单片机控制的DC-DC变换电路
- RS-232接口电路的ESD保护.pdf
- linux下用time(NULL)函数和localtime()获取当前时间的方法
- Openstack用户使用手册.docx
- KUKA KR 30 hA,KR 60 hA机器人产品手册.pdf
- Java programming with JNI
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论1