非纠缠表示驱动的图像去模糊：提升特定领域效果

PDF格式 | 1.11MB | 更新于2025-01-16 | 194 浏览量 | 举报

1 收藏

图像去模糊是一个关键的计算机视觉任务，它致力于从模糊的输入图像中恢复清晰的图像，这对于诸如物体检测和人脸识别等应用至关重要。传统的图像去模糊方法主要依赖于模糊核估计，但由于问题的高不稳定性，需要引入先验知识来约束图像和模糊机制。这些通用先验往往在自然图像上表现不错，但在特定领域如人脸、文本和低光照条件下效果有限。本文创新地提出了基于非纠缠表示的无监督图像去模糊方法。该方法采用内容编码器和模糊编码器，通过分离图像内容和模糊特征来实现解纠缠。关键在于使用KL散度损失来规范模糊属性的分布，减少噪声干扰，确保内容信息的准确提取。针对非配对训练数据，文章引入了模糊分支和循环一致性损失，以确保去模糊后的图像内容结构与原始图像保持一致。此外，为了提升生成图像的真实感，作者还在去模糊结果中加入了对抗性损失。这有助于生成更为自然和清晰的图像。研究者们利用合成数据集和真实图像对进行了广泛的人脸和文本去模糊实验，结果显示，与当前最先进的非配对去模糊算法相比，他们的方法在性能上有所提升，尤其是在处理复杂模糊和特定领域图像时。值得注意的是，尽管基于学习的方法，如CNN和GAN，已经在盲图像去模糊领域取得显著进展，它们的计算效率和生成图像的逼真度得到了提升。然而，这些技术仍需不断优化以适应不同场景和具体应用的需求。本文的工作表明，通过深入理解图像内容和模糊特性之间的关系，以及利用适当的损失函数和训练策略，可以在特定领域取得更好的去模糊效果，且在推理速度上也有所考量。

展开

10227

WGAN和感知损失，并实现国家的最先进的性能，自

然图像去模糊。

领域特定的方法虽然上述方法对于自然图像去模糊

表现良好，但是难以将它们推广到某些特定的图像领

域，例如人脸和文本图像。Pan等人[28]提出了图像强

度和梯度的

正则化先验

3.1.内容和模糊

由于地面实况清晰图像在未配对设置中不可用，因

此从模糊图像中解开内容信息并非微不足道。然而，

由于清晰图像仅包含内容分量而没有任何模糊信息，

因此内容编码器

应该是良好的内容提取器。我们强

制最后一层

和

，

B S

用于文本图像去模糊。 Hradis等人[9]训练一个端到端-

分担权重，以引导E

学习如何有效

end CNN专用于文本图像去模糊。Pan等人[27日]

利用参考集合中的样本面部来指导模糊核估计。Shen

等人[36]利用人脸解析标记作为全局语义先验和局部

结构正则化来提高人脸去模糊性能。

2.2.

解纠缠表示

最近有许多关于学习分解表示的努力。Tran等人[40]

提出了DR-GAN来分离姿态和身份分量，用于姿态不

变的人脸识别。Bao等人[2]显式地分离身份特征和属

性，以学习开集人脸合成模型。Liu等[19]构建一个

从模糊图像中提取内容信息。

另一方面，模糊编码器

应当

仅对模糊信息进行编

码。为了实现这一目标，我们提出了两种方法来帮助

抑制尽可能多的内容信息。首先，我们将

（b）与

（s）一起送入G

以生成

。由于

是s的模糊版本，

并且它将不包含

的内容信息，因此该结构不

鼓励

（

）

对

的内容信息进行编码。其次，我们添加KL发

散损失来正则化分布

模糊特征z

（b）接近正态分布p（z）<$N（0

，

）。如[2]所示，这将进一步抑制包含在

中的内容信

息。的

KL发散损失定义如下：

身份提取和身份消解自动编码器，将身份与其他属性

分离。BicycleGAN [45]结合cVAE-GAN和cLR-GAN来

模拟

∫

（

）||

（

））

= −

（

）log

（

）

（

）

q（z

）

图像到图像转换中的可能输出。最近，一些无监督方

法将图像解耦为领域不变的内容特征和领域特定的属

性向量。

不同的图像之间的转换，

如[13]中所证明的，最小化KL发散等价于最小化以下

损失：

（

−

log（

）

−

1）

（

）

放[17，1，11]。

该方法

该方法包括四个部分：1）模糊和清晰图像域的内容

编码器

和

ii i

其中

，

和

是

的平均值和标准差，

是

的维数。与

[13]类似，z

被采样为z

z<$σ，其中p（z）<$N

（0

，

1）和<$表示逐元素乘法。

2)模糊编码器

; 3）模糊和清晰图像发生器G

和G

;

4）模糊和清晰图像鉴别器D

和D

。给定一个训练样

本b∈B在模糊的im-

年龄域和s∈S在清晰图像域中，

帐篷编码器

并且

从以下

内容中提取内容信息：

3.2.

对抗性损失

为了使生成的图像看起来更真实，我们在两个域上

应用对抗性损失。对于清晰图像域，我们将对抗损失

定义为：

相应的样本和

估计模糊信息从

。

然后取

（

）

和

（

）来生成

= [log

]

c b

[log（1

−

（

）

，

））]

（

）

a sharp image

while

takes

（

）

and

（

）

gen-

使图像模糊。鉴别器

和

（b）

S B

区分真实的和生成的例子。端到端架构如图所示。

二、

在下面的小节中，我们首先介绍在第3.1节中解开内

容和模糊分量的方法。然后，我们讨论了我们的方法

中使用的损失函数。在第3.5节中，我们描述了拟议框

架的测试程序最后，在第3.6节中讨论了实现

其中

试图最大化目标函数以区分

在去模糊图像和真实清晰图像之间进行猜测。相比之

下，

的

目标是最小化损失，使去模糊图像看起来类

似于域

中的真实样本。类似地，我们将模糊图像域中

的对抗性损失定义为

：

（

）

[log

（

）

]

[log

（

1−

（

）

，

）

]

下载后可阅读完整内容，剩余10页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

cpongm

粉丝: 5

非纠缠表示驱动的图像去模糊：提升特定领域效果

图像去模糊

一种基于视觉特性的图像盲去模糊方法

一种基于模糊理论的图像识别方法

基于空间阴影模糊C-均值和I-Ching算子的聚类算法

基于形态学操作的量子遗传算法的点目标检测

ERL-Net：单图像去雨新方法与残差学习

图像处理技术大揭秘：MATLAB图像增强与识别策略

虚部在图像处理中的应用：探索虚部在图像增强和滤波中的作用，揭示虚部在图像处理中的奥秘

字符串模糊匹配算法：Java安全，防止模糊匹配攻击与数据泄露

MATLAB图像恢复与重建技巧

最新资源