没有合适的资源?快使用搜索试试~ 我知道了~
10167一种基于自适应边缘选择的变分EM盲运动去模糊框架刘戈杨 和 辉记新加坡国立大学数学系,新加坡,119076yangliuge@u.nus.edu和matjh@nus.edu.sg摘要盲运动去模糊是近十年来一直受到关注的重要问题。基于这样的观察,即用于估计运动模糊核的潜在图像的良好中间估计不一定是最接近潜在图像的中间估计,边缘选择已经证明其本身是用于在盲去模糊中实现最先进性能的非常强大的技术。本文提出了边选择/重新加权的解释,的变分贝叶斯推理,因此开发了一种新的变分期望最大化(VEM)算法与内置的自适应边缘选择盲去模糊。与避免不必要的局部收敛的重启策略一起,所提出的VEM方法不仅具有坚实的数学基础,而且在基准数据集上明显优于最先进的方法1. 介绍运动模糊是一种常见的图像退化类型。当在曝光时间期间相机和场景之间存在相对运动时,所得到的图像将看起来模糊,这在数字摄影中被称为运动模糊例如,运动模糊的一个常见原因是曝光时间期间的相机抖动。所谓的盲运动去模糊就是从输入的运动模糊图像中恢复出具有清晰细节的清晰图像。本文重点研究匀速运动模糊,即,运动在图像上几乎是恒定的。匀速运动模糊发生在摄像机沿像平面平移当使用具有4倍变焦或更大变焦的移动电话在目标静态对象上拍照时,经常看到均匀运动模糊可以建模为卷积过程:g=k<$f+n,(1)其中,算子f表示离散卷积算子,g表示给定的模糊图像,f表示潜在的清晰图像,k表示由运动确定的未知模糊核,并且n表示噪声。然后,匀速运动去模糊是关于从(1)估计对(k,f),这是一个不适定问题,具有许多很好地拟合(1)的例如,平凡解(δ,g),其中δ表示Delta函数.为了解决这种模糊性,必须对核和潜像施加一定的先验知识来约束可行解的空间这种先验可以以正则化变分模型的形式或在贝叶斯框架中调用,并且它们的解是相同的。例如,最大后验(MAP)估计器是为了找到p(f,k|(g)|f,k)p(f)p(k),其中p(g|f,k)是似然函数,p(f),p(k)是f和p的统计先验。在应用负对数之后,这样的MAP估计器等效于最小化以下:正则化变分模型:minΦ(g-fk)+1(f)+2(k)。(二)f,k其中Φ(·)是保真度项,Φ1(·)、Φ2(·)分别对清晰图像和核进行了正则化例如,自然图像的一个经验统计学将图像梯度建模为相同的从i.i.d.提取的样本。拉普拉斯分布然后,来自这样的统计先验的MAP估计器与基于正则化的总变差相同,1.1. 讨论MAP估计器或来自变分模型(2)的解通常采取交替更新f(或k)和k的迭代过程。在这样的迭代过程中的主要挑战是如何防止序列收敛到次优的不期望的局部最小值或退化平凡解(k∈δ)。沿着这条线一直在进行持久的研究工作,最近的许多工作都基于以下观察:f(或Δf)的中间估计用于帮助更精确地估计核k,而不是接近真实的核k。一旦10168在核的估计完成之后,然后估计最接近真实的图像。因此,来自自然图像统计的先验不一定是用于估计中间结果的图像先验的最佳选择一种方法是修改MAP估计器,使得潜像的中间估计被调整为更好地估计模糊核。有些方法修改了正则化方法中的正则稀疏激励范数,例如:归一化的基于范数的正则化[19]和近似的范数正则化[43]。另一些方法则引入一些启发式步骤来修正中间结果,使所得结果能使核函数的估计朝着正确的方向发展。已经提出了许多策略,包括显著性边缘/区域选择[41,14,29]和去除弱细节并增强显著性边缘的边缘过滤[8]。另一种方法是用变分贝叶斯(VB)方法代替MAP估计量[24,10,23,22,39,1]。与MAP估计器不同,VB方法追求核k的后验均值估计,使得核最有可能相对于可能的清晰图像的分布。此外,如[39,18]中所总结的,基于VB的方法将导致迭代重新加权方案,其具有促进图像梯度域中的稀疏性的效果。Wipf和Zhang [39]表明,当使用高斯尺度混合(GSM)作为图像梯度的先验时,基于VB的框架可以重新表示为具有取决于内核、图像梯度和噪声水平的联合正则化项的非常规MAP框架。VB方法和基于边缘选择的MAP估计方法各有优缺点。VB方法具有数学解释严谨、实现简单、稳定性好等优点.然而,它们的实验性能并不是最先进的。然而,基于边缘选择/加权的MAP方法依赖于用于边缘选择/加权的一些启发式策略基于边缘选择的方法在模糊度较大的图像上表现良好,但在模糊度较小的图像上表现不佳。1.2. 我们的贡献基于图像盲去模糊中边缘选择/加权的显著性能增益,本文从VB推理的角度出发,建立了盲去模糊中边缘选择/加权的数学基础。在此基础上,提出了一种新的基于边缘重加权的VEM去模糊方法。盲去模糊中的边缘选择/重新加权的理解在VEM方法的框架中,而不是查看la-与现有的VB方法一样,我们将隐变量解释为图像梯度,以便更好地估计模糊核。实现这种潜变量的关键思想是将潜变量建模为一组独立的随机变量,其标准偏差由来自边缘选择/重新加权的先验激励正则化。这种方法的结果导致一个新的VEM方法与内置的自适应边缘选择。据观察,所提出的VEM方法有时会收敛到次优的局部极小值,这实际上也是大多数VB方法的问题。针对VEM算法的盲去模糊问题,提出了一种重新启动策略,有效地避免了VEM算法的次优局部收敛,特别是在模糊度较大的情况下结合重新启动策略,本文提出的VEM盲运动去模糊方法具有坚实的数学基础,对图像内容变化具有良好的稳定性在合成数据集和真实图像上的大量实验表明,该方法的性能明显优于大多数现有方法。2. 相关工作有大量的文献对盲去模糊只使用一个图像(例如,[41,8,32,10,19,23,34,43,47,25,28,30,12,45,9,11])或使用多个图像(例如,[4、31、7、46])。我们只关注与所提出的方法非常相关的单图像盲正则化方法。在MAP估计的框架中,过去已经开发了许多类型的正则化用于盲运动去模糊。例如,Caiet al.[3,5]提出了通过最小化其小波/小框架变换的N1为了解决仅使用n-1-范数相关正则化时对退化解的偏置问题,Krishnanet al.[19]建议将其替换为正规化的N1-范数,即,图 像梯度上的1/2/2。 在[43]中,提出了一种新的稀疏提示函数,该函数逼近图像梯度的x 0-范数。对于文本图像,Pan等人[28]提出了通过最小化强度和图像梯度的N0范数来正则化去模糊而不是使用图像梯度,太阳等人。[34]介绍了一种专门针对图像边缘和角点的图像块先验,用于盲去模糊。Michaeli和Irani [25]提出了一种不同的图像补丁先验,利用图像块在多个尺度中的递归。边缘处理相关技术。 基于对清晰图像进行中间估计以更好地指导模糊核的估计的思想,Cho和Lee [8]提出了一种快速去模糊算法,该算法通过使用作为模糊核的图像迭代地估计模糊核来实现。10169q(z)不中间恢复图像的修改版本。修改是通过首先运行冲击滤波器上重新覆盖的图像,然后只保留边缘被选中q(z)>0。然后由Jensen∫使得其直方图是取向各向同性的。Xu和Jia [41]提出了另一种基于logp(y;θ)≥p(y,z;θ)q(z)logdz.q(z)跨度小于核的支持的那些边缘的观察结果将把核估计引向错误的方向。基于一种新的边缘显著性度量,[41]中构建了一个显著边缘图,以便于估计模糊核。在[29]中,提出了显着结构的不同定义。而不是使用显着的边缘,胡等人。[14]提出了选择核估计的图像区域。在[12]中,Gonget al.提出了一种自适应的边缘选择算法,该算法通过引入具有稀疏基数约束的二元梯度激活向量来进行优化。变分贝叶斯框架。它在Levinet al. [22]许多简单的MAP方法可能会失败,因为它们大多支持琐碎的解决方案。VB方法,定义F(q,θ)=<$q(z)log p(y,z;θ)dz。而不是...直接最大化边际对数似然,期望最大化(EM)算法最大化下限F(q,θ):(q∈,θ∈)= argmax q,θ∈Θ F(q,θ).与标准EM相比,变分EM(VEM)方法通过将q约束在某个分布族Q内来解决上述优化问题。这个优化问题通过交替地最大化函数F(q,θ)在q(z)∈ Q和θ ∈ Θ之间。对于第t次迭代,1. E-step. 使用θt−1更新q(z):最大化边缘化分布已经被提出,qt=argmaxq∈QEq(z)[logp(z,y;θt−1)q(z) ](三)以代替MAP估计器来解决这个问题;参见例如,[10,22,23,39,1]。Fergus等人[10]使用I.I.D.采用Miskin和MacKay算法迭代更新图像和核的估计值Levin等人[23]还使用零均值高斯的混合来对图像导数进行建模。不同于Ferguset al. [10],他们引进了一套i.i.d.隐变量来表示每个图像梯度产生的混合成分,并采用了一个VEM框架,该框架利用平均场近似。Babacan等人[1]提出了一种基于超高斯图像先验的VB方法。Wipf和Zhang [39]分析了VB方法和MAP方法。他们表明,具有GSM先验的VB框架所使用的底层代价函数可以重新表示为非传统的MAP代价函数,其联合正则化项取决于内核、图像梯度和噪声水平,=argminq∈QKL(q(z))||p(z|y;θt−1))。2. M步使用qt更新θ:θ=argmaxθ∈ΘEqt(z)[logp(z,y;θ)],(4)其中,Θ表示参数的可行集合,并且KL(q||p)表示q和p之间的KL-散度。看到[2]有关EM或VEM3.2. VEM中的问题公式化在图像梯度的域中估计核通常是更优选的,即,核估计为:g=k正如[28,41,8]中所指出的,并非所有x图像梯度上的正则化的迭代是自适应的。在迭代优化过程中不断变化深度学习方法。近年来,已经提出了许多基于深度学习的方法用于盲运动去模糊。参见例如[20,26,44,35,42,27,6,40,33]。3. 主体3.1. 关于变分EM的若干问题考虑一个包含观测变量y和潜变量z的概率模型,参数为θ∈Θ。θ的最大边际似然估计由下式给出:∫梯度在BLOG是有帮助的核估计。考试-[41]这是一个很好的例子,因为它是一个很好的例子。具有小跨度的图像边缘可能对核估计具有负面影响此外,如[18,12]中所证明的,即使在核估计中仅使用图像梯度的一部分,也可以获得良好的核估计 换句话说,当用于估计核k时,真实图像梯度的近似值Δz可能做得更好。令Rzz表示与Rzf相关的图像梯度场,但更适合于内核k的估计。在本文中,我们模型的潜随机变量的高斯分布与零均值和可逆的对角线,最终协方差矩阵即,p(y;θ)=argmaxθ∈Θp(y,z;θ)dz.YNp(z)=N((Z)i|0,σ2),设q是z上的任意概率分布,使得我i=11017010x我xxxx其中,对于常数τ,σi≥τ。需要在协方差矩阵上施加一定的先验,以约束分布空间。如在[18,12]中所观察到的,适合于核估计的图像gra通常具有大的mag。nitude.这样的先验可以如在s.t.d. 由于具有零均值和大标准差的随机变量如果它有大的s.t.d.,它更有可能有大幅度的实例。 只有一小部分-这种图像梯度的年龄应该足以估计k。这种观察促使我们提出{σi}i的基数先验:#{i:σi> τ}≤M(M<$N)其中#表示集合基数,M是常数(在我们的实现中=N)。在VEM的上下文中,我们可以重新定义内核盲去模糊的估计如下。• 观测变量:g∈RN。• 潜变量:z∈RN,如下YN(a)模糊图像g(b)清晰图像f(c)z来自(12)(d)其他事项|f|(e)|f|(f)真相k(g)|伊茨|[23](h)|伊茨|[23](i)估计kp(z)=i=1N((Z)i|0,σ2)。 (六)和往常一样,p(|n(z,k)=N(g)|其中,σk是噪声水平。• 参数:θ:= [k,θZ]∈Θ,其中k表示模糊核和θZ:={σi}N是(j)|伊茨|我们的(k)|伊茨|从我们的(l)估计k。图1:潜在变量z=[z,z]的图示。i=1的分布。参数的可行集Θ(匹配使用我们的算法(12);(d)-(f):图像梯度被定义为Θ:={(k,θZ):Σk[j]= 1,k [j]≥0;J(g)-(i):来自[23]的潜在变量Rz和最后一个循环中的结果核;(j)-(l):来自拟议的σ i≥ τ,#{i:σ i> τ} ≤ M}。( 七)• 变分近似我们采用了与Levin等类似的近似方法。[23]这样,Q是具有对角协方差的高斯分布的集合。能量矩阵然而,与[23]不同的是,我们将协方差矩阵限制为具有预定义常数λ的λI:Q:={N(μ,λ I):μ∈ R N}。 (八)这样的集合在计算上更有效,但方法和最后一次循环中的结果内核。 内核是估计使用(15)。反对意见1. F或θ(t)=[k(t),θ(t)],优化问题(9)的解q(z)= N(z|其中(λz)λ是以下问题的最小值:而不是降低性能。minǁ∇g−k(t)⊗∇zǁ2+σ˜2ǁ(Σ(t))−1∇zǁ2.(十一)克罗地亚122见图1以说明[23]和我们的潜变量。我们的变量αz比[23]中的变量αz更稀疏,并且更多地关注具有大幅度的边缘。3.3. e步骤给出一个估计θ(t),E-step的目标是细化证据 详细证明见补充资料。在上述E步骤的推导中,通过假设Δ z和Δ z是独立的来估计变量(Δz)Δ z这样的假设忽略了现有的相关性,用解λ zλ x估计qar gminq∈QKL(q(z))||p(πz|θ(t))。(九)10171很好首先估计z,然后计算因此,我们实现了一个修改后的E-10172σ我2我2Σ22第二次 世界大战I2首先估计z的步骤为: 参见图2(d)z(t+1)=阿革米因.λ||g−k(t)z||2VEM方法的一个版本似乎被困在z[j]≥0021Σ在一些局部极小值中,+||g−k(t)||2+σ2||((t))−2z||二、2 2(十二)然后赋值(z)=z(t+1):=[z(t+1),z(t+1)]。示于图第2段(c)分段。 换句话说,VEM方法可以避免琐碎的解决方案,但可能会被困在一些地方3.4. m步x远离真相。 这种现象可能是这是由于(1)相应优化问题的高度非凸性质,以及(2)上-Giv enq(t+1),M步是通过求解优化问题来更新参数θ=[k,k]的估计VEM方法的日期仅保证F(q,θ)不减。θ(t+1)=argmaxθ∈ΘEq(t+1)(z)[logp(μz,μg;θ)],(13)在解决高度非凸问题时,一种经常用于规避此类问题的技术是引入其中,q(t+1)(t/z)表示来自E步骤abovee的输出。首先,我们需要计算期望值并简化上述问题。 设h(θ)= logp(θz,θg; θ). 然后,h(θ)= log p(θg| logp(θ)+log p(θ)=10gN(μg|kz,σ2I)+logN(z|0,)=log[1exp(−||格格-克-布雷兹||2)]一些重新开始的策略,以允许迭代跳出局部最大值点。在这一节中,我们提出了一个重新启动的策略,估计的参数。再-所谓潜在变量可以被看作是一个近似值,模拟到修改的BMF,以更好地估计模糊核。因此,本文提出的重启策略是重启使用现有的关于BAF的估计来估计BAF,(2πσ<$2)N/22σ˜2称为多次迭代。 设f ≠f的估计+lo g[1exp(−1||−2||2)]n(2π)N/2|Σ|1/22使用简单的Tikhonov正则化方法:=−1||2+ σ2||−1||2]||2]22σ˜2−Nlogσ−Σilogσi−N log(2π),f=argminf||g−kf||2+λ1||f||二、(十七)2 2其中,N是n =z的维数。然后,通过直接计算,优化问题(13)等价于其中k是模糊核的最新估计值,λ111Σθ∈Θ2σ˜Σ2||∇g − k ⊗∇z(t+1)||2+σ2||−1(t+1)||2]是一个常数(在我们的实现中=400)。 记得从命题2中,我们可以看到,+logσ+λN||K||2+λ1、σi≥τ是大的,仅当其相应的梯度是ii2σ22i2我(十四)足够大,其值主要由其中Θ在(7)中定义对于k和k,上述优化问题独立地求解如下。对于k,通过忽略不相关的项,我们有:梯度的大小因此,我们定义了diagonal对角线,如下。设Λ表示M的指数集最大条目|∇f ∗|. 然后,σ定义为:.|(f)|如果|(f)|> τ和i ∈ Λτ,时间(t+1)2 2σi=i i(十八)k=argmink∈Θ <$$>g − <$z<$k<$2 + λN ||K||二、(十五)否则。对于m,令Λ表示m的M个最大条目的索引集,|.|. 然后,我们有以下内容:第二个提案。 问题(14)的解决方案w.r.t. 埃里西斯g iv en by Σn=dia g((σn)2,.,(σ)2),其中注意,(17)使用空间均匀的自然图像先验,因此重新开始过程本质上所做的是在每几次VEM更新之后选择自然潜像上的边缘,而不是从那些图像中连续选择边缘,1N1998年,|(z(t+1))|2+λ)1if(|(z(t+1))|2+λ)1>τ形式(12),其中可能只包含如图所示的边缘的一部分。第1段(c)分段。联系我们且i∈Λ,否则。(十六)见图2,以说明如何重新启动计算效率更高,并将内核估计引导到正确的方向。 可以看出,在内部循环中的5次迭代之后,对k的估计几乎不一致。min10173证据 详细证明见补充资料。3.5. VEM方法的重新启动技术虽然众所周知基于VB的算法可以有效地避免平凡解(k=δ)[23,39],但我们发现,特别是当模糊度为改变,即。 k(5,j),k(10,j),k(20,j)都是相似的。 相反,如果我们在恢复k(5,j)之后使用重新开始,则重新开始的估计k ( 1 ,j+1 )如图所示。第 2(h)条显然更接近事实。这表明重新启动的有效性看到图图3(d)-(g)和(h)示出了在一个外循环期间,内循环如何更新Iz及其协方差矩阵Iz的估计。可以看出,迭代将产生更稀疏的图像梯度。101744102(a) 输入g(b)输出f(c)输出k(d)k(1,j)(a)(1/2)(0,j) (b)(1/2)(0,j) (c)(第1/2段)(4,j) (d)(1/2)(4,j)x y x y(e)k(5,j)(f)k(10,j)(g)k(20,j)(h)k(1,j+1)(e)|n(1,j)|(f)第(1)款|n(1,j)|(g)|n(5,j)|(h)|n(5,j)|x图2:重新启动如何帮助VEM算法避免局部收敛到次优解的说明。(a)- (c):模糊图像g和最终输出图像f和最终输出核k;(h):仅在内循环中5次迭代之后重新启动VEM之后的k的估计,即在k(5,j)之后重新开始的估计。在该示例中,j=2。输入图像取自[17]中的数据集通过在基于VEM的交替迭代中加入重新启动过程,我们得到了一种基于VEM的重新启动运动模糊核估计经过足够的迭代次数后,我们得到了核的精确估计,记为k。 清晰图像f的恢复成为经典的非盲反卷积,它解决了线性问题:g = kf + n。 有几种非盲去模糊方法使用估计的核去模糊图像的优化;参见例如。[15,16,37]。为了公平比较,我们还采用了[37]中提出的去模糊算法,该算法用于几个现有的比较研究了盲运动去模糊。关于所提出的重新启动方法的概述,请参见算法14. 实验4.1. 重要的实施细节为了处理大的模糊,我们采用了通常的做法,采取一个粗到细的估计方案,假设在粗尺度上的核的估计是一个很好的初始化核在在在粗尺度下,使用σ=3的3 × 3高斯核初始化核,并调用Alg。1来估计内核。之后,使用双线性滤波器对估计的内核进行上采样。插值,并作为初始化的内核估计在更精细的规模。具有从粗到细尺度的图像集合从输入图像开始,通过将当前尺度中的图像减半来构造较粗尺度中的每个图像。数字-尺度的误码率取决于需要多少下采样来将最大内核大小调整为3 ×3。图3:变量更新的图示|塞兹|及其{σi}i在外部迭代j=2中。(a)-(b):在第一次迭代中使用的12,(c)-(d):在最后一次迭代(第5次迭代)中使用的12;(e)-(h):使用(12)得到的对12的估计。算法1VEM方法概述一曰: 输入:模糊图像g2:输出:清晰图像f,模糊核k第三章: %核估计4:初始化n:设置初始内核k(0,0)。5:对于j = 1,2,. . . ,m do6:重新启动:按照第6节中的描述定义k(0,j)。三点五7:对于t = 1,2,. . . ,n do8:E步骤:通过(12)定义Δz(t,j)9:M步:通过(15)定义k(t,j)10:通过(16)定义k(t,j)11:结束12:设置k(0,j+1):= k(n,j)。13:结束14:设置k=k(n,m)。15:%非盲去模糊,使用k阶16:使用[37]中的方法估计f对于测试数据集上的实验,使用差分算子[-1,1]和[-1,1]π计算图像灰度。参数统一设置如下。内部迭代的次数n=5,外部迭代的次数m=12。基数约束的常数M对于水平和垂直梯度都被设置为N其中N表示图像像素的数量 对于其他参数,σ=10−5,τ=10−3,λ=0。001/N。算法1的最后一步调用非盲例程,[37]迭代次数= 100。(12)、(17)和(15)都是二次规划问题。在我们的实现中,他们只是解决了第一次使用共轭梯度(CG)方法作为无约束问题,然后通过投影到他们的可行集。10175费格斯[10个国家]Cho[八]《中国日报》徐-10[41个]克里希南[19个]莱文[23日]孙[34个]徐-13[四十三]张[46个]钟[47个]Michaeli[25日]潘[28日]Perron[30个]Nah[26日]我们人造14.1016.1119.5615.6718.0219.3017.8716.9317.3217.3217.3317.5315.6319.99自然16.4420.0923.3819.2420.9323.6922.1421.3821.0720.6621.4722.0818.4524.33人18.4619.8926.5021.3422.9526.1325.7224.5824.3924.2024.3324.0420.5827.22饱和12.7314.2315.5914.1114.8114.9515.0014.9214.8614.3015.1113.8914.4617.04文本13.6514.8219.6815.1115.8018.3518.6116.1115.8615.2217.5616.8014.2120.35平均15.0917.0320.9717.0918.5020.4819.8718.7818.7018.3419.1618.8716.6721.79表1:[21]中合成均匀数据集的定量比较性能以平均PSNR值衡量不同行表示不同类别的图像。最后一行是整个数据集的平均PSNR值Whyte等人[38个]Hirsch等人[13个国家]Shan等人[32个]Krishnan等人[19个]赵和李[八]《中国日报》徐和贾[41个]Yue等人[45个]Gong等[12个]我们图像127.547526.723226.425326.865428.909329.405430.134030.357231.7060图像222.869622.586720.595021.755124.272725.479325.474925.521026.3540图像328.611226.415525.881926.644329.197329.304030.177731.657731.0048图像424.706523.536422.395422.870126.606426.760126.766127.480427.9150总平均值25.933724.815523.824424.533727.246427.737228.115828.754129.2249表2:Kohler数据集的定量比较[17]。性能以平均PSNR值衡量。4.2. 定量评价合成数据集来自Laiet al. [21]第20段。为了测试我们的方法对不同类型的图像具有不同大小的模糊,我们采用了最近的基准数据集建立赖等。[21],其中包含100个模糊图像,分为5类。它们是用4种不同的核,大小从51×51到101×101,1%高斯噪声。除了深度学习的结果-ing方法[26],表1”[21]这是他的座右铭。我们首先下载了[21]在线发布的估计内核,然后运行相同的非盲去模糊算法,Whyte等人。[37]他们的代码在网上发布,以获得去模糊图像进行比较。[26]的结果是通过使用作者发表的训练模型得到的。关于在平均PSNR值方面的方法的比较,参见表1。可以看出,我们的方法在所有类别上都优于其他方法,特别是在“人”和“饱和”类别这表明,在所提出的框架中的自适应边缘选择是更强大的比现有的边缘选择技术,例如。[41,8]。SSIM [36]的比较和一些例子的演示可以在补充材料中找到。Kohler数据集[17]。 我们还测试了所提出的方法对这些图像的运动模糊是不完全均匀的。使用Köhler数据集[17]进行测试,该数据集包含48个真实模糊图像,这些图像是通过将4个潜在清晰图像与12个模糊核卷积生成的,其大小范围为41×41至141×141。该数据集通过记录六维相机运动的采样来PSNR值的比较见表2其他方法的结果直接引用[12,45]。可以看出,所提出的方法总体上明显优于所比较的方法。4.3. 真实图像实验所提出的算法也评价真实图像总结赖等人。[21]第20段。我们将我们的方法与具有最佳性能的六种代表性方法进行了比较,包括两种边缘选择相关方法:Cho等人[8],Xu and Jia [41],两种正则化方法:Xuetal.[43] Panet al. [28],一种VEM方法:Levin等人[23]一种深度学习方法:[26]第10段。这些方法的介绍可以在第2节中找到。结果的目视检查可以看出,来自所提出的方法的更多结果的说明可参见补充材料。5. 结论本文从VB推理的角度重新讨论了用于盲运动模糊去模糊的强大的边缘选择/重加权技术。通过建立边缘选择的数学基础,我们提出了一种基于边缘选择/重加权的VEM盲运动去模糊方法。与重启策略一起,所提出的VEM方法易于实现,对不同的内容稳定,并提供最先进的性能。谢谢。这项工作得到了新加坡MoE AcRF Grant MOE 2017-T2-2-156的部分支持。10176(1.a)输入(1.b)Cho-09 [8](1.c)Xu-10 [41](1.d)Xu-13 [43](1.e)[28](1.f)Levin-11 [23](1.g)DeepDeflur-17 [26](1.h)Ours(2.a)输入(2.b)Cho-09 [8](2.c)Xu-10 [41](2.d)Xu-13 [43](2.e)[28](2.f)Levin-11 [23](2.g)DeepDeflur-17 [26](2.h)Ours(3.a)输入(3.b)Cho-09 [8](3.c)Xu-10 [41](3.d)Xu-13 [43](3.e)[28](3.f)Levin-11 [23](3.g)DeepDeflur-17 [26](3.h)Ours图4:不同方法结果的目视比较。放大以便于检查10177引用[1] S. D.巴巴詹河Molina,M. N.做,和A。K.卡萨格-洛斯。一般稀疏图像先验的贝叶斯盲反卷积ECCV,第341-355页,2012年[2] C. M.主教模式识别与机器学习。New York:Springer,2007.[3] J. - F. 蔡氏H.吉角,澳-地Liu和Z.沈基于稀疏逼近的单幅图像盲运动在CVPR中,第104-111页。IEEE,2009年。[4] J. - F. 蔡氏H.吉角,澳-地Liu和Z.沈使用多个图像的盲运动J.计算机Physics,228(14):5057 - 5071,2009.[5] J. - F.蔡氏H.吉角,澳-地Liu和Z.沈基于小帧的单幅图像盲运动去模糊。IEEE传输图像处理。,21(2):562[6] A.查克拉巴蒂盲运动去模糊的神经方法。在ECCV,2016年。[7] 陈杰湖,澳-地袁,C.- K. Tang和L.权强大的双重运动去模糊。CVPR,2008。[8] S. Cho和S.李你快速运动去模糊。ACM TOG(Proc·SIG-GRAPH Asia),28(5):145:1[9] T. S.周,S。巴黎湾K. P. Horn和W. T.弗里曼。使用Radon变换的模糊核估计在CVPR,第241-248页[10] R. 费格斯湾辛格A.Hertzmann,S.T. Roweis和W.T.弗里曼。从单张照片中消除相机抖动ACM TOG(Proc.SIGGRAPH),25(3):787 -794,2006.[11] A. Goldstein和R.肥塔尔来自谱不规则性的模糊核估计ECCV,2012年。[12] D. Gong,M.谭,Y。Zhang,中国古柏A. v. d. Hengel和Q.石自动梯度激活的盲图像反卷积在CVPR,第1827-1836页[13] M. 赫 希 角 J. Schule r,S. Harmeling 和B. Sch oülkopf. 快速消除不均匀的相机抖动。见ICCV,第463-470页。IEEE,2011年。[14] Z. Hu和M.- H.杨去模糊的良好区域。见《欧洲法院判例汇编》,第59-72页。Springer,2012.[15] H. Ji和K.王. 鲁棒的图像去模糊与不准确率模糊核。IEEE传输图像处理。,21(4):1624[16] H. Ji和K.王.一个两阶段的方法来盲空间变化的运动去模糊。见CVPR,第73-80页。IEEE,2012。[17] R. Kohler,M. 赫希湾,巴西-地 Mohle r,B. Scho¨lk opf,以及S. 伤害。 相机抖动的记录和回放:用真实世界的数据库对盲反卷积进行基准测试。在ECCV,第27-40页[18] D.克里希南,J。Bruna和R.费格斯。重加权稀疏提升盲解卷积。ArXiv电子印刷品,2013年。[19] D. Krishnan,T. Tay和R.费格斯。使用归一化稀疏性测量的盲反卷积。CVPR,2011。[20] O. Kupyn,V. Budzan,M. Mykhailych,D. Mishkin和J.马塔斯Deblurgan:使用条件对抗网络进行盲运动去模糊。ArXiv电子印刷品,2017年。[21] W.- S.赖,J. - B. Huang,Z. Hu,N. Ahuja和M. H.杨单幅图像盲去模糊的比较研究。在CVPR,2016年。[22] A. Levin,Y. Weiss,F. Durand和W. T.弗里曼。理解和评估盲解卷积算法.见CVPR,第1964-1971页[23] A. Levin,Y.Weiss,F.Durand和W.T. 弗里曼。盲反褶积中的有效边际似然优化。CVPR,2011。[24] A. C. Likas和N.P. 加拉塔萨诺斯一种基于变分的盲图像反卷积方法 IEEE Trans. Sig. Proc. ,52(8):2222[25] T. Michaeli和M.伊拉尼使用内部补片递归盲去模糊。2014年,在ECCV[26] S.不T H. Kim和K. M.李你用于动态场景去模糊的深度多尺度卷积神经网络。在CVPR,2017年7月。[27] M. 诺鲁齐山口Chandramouli和P.法瓦罗运动去模糊-环在野外。在GCPR,2017年。[28] J. 潘,智-地Hu,Z.苏和MH. 杨 基于灰度和梯度先验的文本图像去模糊。CVPR,2014。[29] 潘河Liu,Z. Su和X.顾基于显著结构的核估计用于鲁棒运动去模糊。信号处理:Image Communication,28(9):1156 -1170,2013.[30] D. Perrone和P.法瓦罗总变差盲解卷积:细节决定成败。CVPR,2014。[31] A. Rav-Acha和S.法勒两个运动模糊图像优于一个。Pattern Recognition Letters,26:311-317,2005。[32] Q. Shan,J. Jia,and A.阿加瓦拉高品质的运动去模糊从一个单一的图像。ACM Trans. Graph,27(3):73,2008.[33]S. 苏,M。Delbracio,J.Wang,G.Sapiro,W.海德里希,以及O.王. 用于手持相机的深度视频去模糊。在CVPR,第1279-1288页[34] L. 孙习Cho,J.Wang和J.海斯基于边缘的模糊核估计使用补丁先验。InICCP,2013.[35] X. Tao,H.Gao、X.Shen,J.Wang和J.贾用于深度图像去模糊的尺度递归网络。在CVPR,2018年。[36] Z. Wang,中国山核桃A. C. Bovik,H. R. Sheikh和E.西蒙切利图像质量评估:从错误可见性到结构相似性。IEEE传输图像处理。,13:600 - 612,052004.[37] O. Whyte,J. Sivic,and A.齐瑟曼。去模糊抖动和部分饱和的图像。IJCV,110(2):185[38] O. 怀特,J。Sivic,A.Zisserman和J.庞塞抖动图像的非均匀去模糊。IJCV,98(2):168[39] D. Wipf和H.张某再谈盲目反革命。J.马赫学习. Res. ,15:3775[40] L. Xiao,J. Wang,W. Heidrich和M.赫希学习高阶滤波器,用于文档照片的有效盲解卷积。在ECCV,2016年。[41] L. Xu和J. Jia.用于鲁棒运动去模糊的两阶段核估计。ECCV,2010年。[42] L. Xu,J. Ren,C. Liu和J. Jia.用于图像去卷积的深度卷积神经网络。NIPS,2:1790-1798,2014年1月。[43] L. Xu,S. Zheng和J.贾自然图像去模糊的非自然l0稀疏表示。CVPR,2013。10178[44] R. Yan和L.邵通过深度学习进行图像模糊盲估计。IEEE传输图像处理。,25(4),2016.[45] T. Yue,S. Cho,J. Wang,and Q.戴.融合边缘和功率谱信息的混合图像去模糊。2014年,在ECCV[46] H. Zhang,L.Wipf和Y.张某基于耦合自适应稀疏先验的多图像盲CVPR,2013。[47] L. Zhong,S.周,D. Metaxas,S. Paris和J.王.用方向滤波器抑制单幅图像去模糊中的噪声。CVPR,2013。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功