4米Yang等人
建议减轻过度拟合的风险。不同的数据增强技术,包括可微[46],非
泄漏[20]和自适应伪增强[17],旨在扩展有限的训练数据。Lecam[39]
正则化的输出,以避免过度拟合。不同于这些eff-fasting无条件的图像
生成有限的数据,在本文中,我们试图生成一个特定的类别时,从这
个类别的一些图像的新图像。
GANs
中的小波变换。
小波变换将给定信号分解为不同
的频率分量,在
各种生成任务中取得了巨大成功,例如风格转换[43],图像重建[18],图
像修复[44],图像编辑[9]和图像超分辨率[6][16]。这些方法试图缩小频域
中的信息差距,以提高模型例如,Jiang et al. 提出焦点频率损失,以避
免图像重建任务的重要频率信息的损失[18]。WaveFill[44]将图像分解为
多个频率分量,并使用分解的信号填充损坏的图像区域,从而实现卓越
的图像修复。与这些方法不同的是,我们试图在只有少量数据的情况下
生成真实的、似是而非的图像。我们感兴趣的是频率信息的影响,具有
挑战性的少数拍摄图像生成。
少数拍摄图像生成。
受人类从少量观察中获得的巨大概括能力的启发
,
少镜头图像生成模型试图在给定少量图像的情况下生成新图像。现有的少
镜头图像生成方法可以大致分为三类:1)基于优化的方法,2)基于
融合的方法,以及3)基于变换的方法。DAGAN[1]将组合的投影潜码
和编码图像转换为新的图像。基于优化的方法FIGR[4]和DAWSON[27]
分别将生成模型与基于优化的Meta学习Reptile[32]和MAML[8]相基于
融合 的方法融 合 局 部 特 征 [12] 或 输 入 图 像[15][14]以合成新 图像。
GMN[2] 将 VAE[25] 与 匹 配 网 络 [40] 相 结 合 , 以 捕 获 少 量 分 布 。
MatchingGAN[14]将随机向量与给定的真实图像匹配,并将融合特征
映射 到 新 图像 。 F2GAN[15] 进 一 步 改 进 了 具有 融 合 和 填 充 范 例 的
MatchingGAN通过融合具有语义相似性的局部表示,LoFGAN[12]提高
了生成质量。值得注意的是,零镜头或少数镜头的文本到图像生成方
法[37][11][36]最近取得了很大的进展因此,本文重点讨论的问题,少
拍图像生成生成新的图像为一个给定的类中定义的第二节。3. 1 .
然而,现有的方法忽略了频率分量对生成图像质量的影响,导致生成
器合成具有更多伪影和更少细节的不利图像。在本文中,我们提出了一
个频率感知的模型,可以生成吸引人的和逼真的图像,通过添加低和高
频率的跳过连接的发生器。这种设计减轻了发生器合成高频信号的压
力。我们的工作从频域的角度探索了一种有效的少拍图像生成解决方
案,它补充了以前的基于融合的方法。