属性转移中的退化与歧义挑战及解决策略

28 浏览量更新于2024-06-20 收藏 18.3MB PDF 举报

属性转移中的退化和歧义问题是一个关键的研究领域，它涉及到在计算机视觉和机器学习中，如何设计和训练模型来有效地在不破坏其他属性的前提下，将一个图像的特定属性转移到另一个图像。这项研究由Attila Szabó、Qiyang Hu、Tiziano Portenier、Matthias Zwicker和Paolo Favaro等专家合作进行，他们在伯尔尼大学和马里兰大学展开。核心任务是构建自动编码模型，该模型的编码部分应能清晰地区分出输入图像对中的共享属性和变化属性。然而，这一过程并非易事，面临两大挑战： 1. 捷径问题（Shortcut Problem）：模型可能会找到一种快速、低效的方式来完成属性转移，这称为“捷径”。这种情况下，模型可能依赖于输入图像中与目标属性不直接相关的其他特征，而非真正理解并转移所需属性。为解决这个问题，研究人员引入了新的约束，如图像对和三元组的约束，并通过理论分析和实验验证了这些约束的有效性，以防止模型学习到不恰当的映射策略。 2. 参考模糊性（Reference Ambiguity）：属性的表示在不同的图像中可能有不同的解释。这意味着即使在理想情况下，构建一个能够确保在所有图像上都具有相同属性解释的模型是不可能的。这一问题挑战了模型的一致性和可解释性。研究者们通过实验验证了他们的发现，指出经过训练的神经网络在实际应用中往往并未显示出明显的参考模糊性。这表明，在实践中，虽然理论上的限制存在，但神经网络可能能够学习到相对稳定的属性转移方式。属性转移中的退化和歧义问题反映了在构建复杂模型时必须面对的现实挑战，即如何在保持模型效率的同时，确保模型的准确性和泛化能力。通过引入新约束和理解这些潜在问题，研究人员有望改进模型设计，提高图像属性转移的精确性和可靠性。

理解属性转移中的退化和模糊性3

特征（见图1b）;

3）我们展示了对参考模糊性的分析，并证明当只使用弱标签时，在解缠任务中这是不可

避免的。在图1c中，图像由两个汽车属性来描述：视角和类型。在这种情况下，参考模

糊性意味着从一幅图像提取的视角可能与不同汽车类型的视角具有不同的含义。令人惊

讶的是，这种模糊性似乎很少发生，通常只有在数据对所关注的属性的依赖性很复杂时

才会发生。

2相关工作

在本文中，我们使用自动编码器作为主要模型来构建特征并合成新数据。因此，我们简

要回顾与自动编码器相关的方法。由于我们使用对抗性方案训练我们的模型，我们还简

要概述了该领域的一些最新进展。最后，我们讨论了与我们目标密切相关的解缠因素的

先前工作。自动编码器。自动编码器[2,9,1]学习将输入数据重构为x=

Dec(Enc(x))，其中Enc(x)是内部图像表示（编码器），Dec（解码器）重构编码器的输

入。变分自动编码器[10]使用生成模型p(x,z)=p(x|

z)p(z)，其中x是观察到的数据（图像），z是潜在变量。编码器估计后验的参数，Enc(x)

=p(z|x)，解码器估计条件似然，Dec(z)=p(x|

z)。变换自动编码器[8]使用转换后的图像输入对进行训练。相对变换参数也被馈送到网

络中。由于内部表示明确表示了对象的存在和位置，网络可以学习它们的绝对位置。自

动编码器的一个重要方面是它们鼓励潜在表示尽可能多地保留有关输入的信息。GAN。

生成对抗网络[7]使用两个竞争的神经网络来采样逼真的图像。生成器Dec从随机噪声样

本z创建图像x=

Dec(z)，并试图欺骗判别器Dsc，判别器必须决定图像是从生成器pg还是真实图像preal

中采样的。经过成功训练，判别器无法区分真实样本和生成样本。对抗性训练经常用于

对随机变量施加（隐式）约束，就像我们所做的那样。例如，BIGAN

[6]通过训练编码器Enc，使得当xpreal时，Enc(x)服从高斯分布。CoGAN

[13]通过在每个域中具有生成器和判别器，并共享它们的权重，学习多域图像的联合分布

。它们可以在不给出对应关系的情况下在域之间转换图像。InfoGan

[4]通过使用判别器来复制输入向量的部分来学习一部分变化因素。解缠因素的许多最近

方法使用神经网络。其中许多是完全监督的[16,22,11,18,

19]，即它们对所有要解缠的因素使用标签。例如，Peng等人[16]使用包括身份、姿态和

标志在内的多个标签来源解缠面部身份和姿态。与身份和姿态相关的

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

属性转移中的退化与歧义挑战及解决策略

识别退化多边形的顶点

数字图像的退化与复原

半导体模型中退化漂移—扩散问题解的存在性.pdf

混沌系统的退化和抗退化

hive中的维度退化

深度神经网络退化问题

残差块如何解决模型退化问题

用MATLAB读入一幅图像，利用大气湍流退化函数将图像进行退化处理，保存退化图像。同屏显示原始图像、退化图像，并标注大气湍流退化函数参数，计算退化图像的峰值信噪比PSNR。

森林退化和气候变化的关系

维度表与事实表维度退化形成宽表

最新资源