深度学习新篇章：生成式对抗网络(GAN)解析

需积分: 0 166 浏览量更新于2024-08-05 收藏 407KB PDF 举报

"41.生成式对抗网络（GAN）基础 - 知乎1" 生成式对抗网络（GAN，Generative Adversarial Networks）是由Ian Goodfellow在2014年提出的，这是一种用于深度学习的创新性框架，特别是在计算机视觉领域中用于生成逼真的图像。GAN的核心思想是通过对抗性的训练过程，让生成器（Generator）和判别器（Discriminator）相互竞争，从而提高生成模型的质量。 1. 判别模型与生成模型在GAN出现之前，深度学习的主要应用集中在判别模型上，如图像分类、目标检测等。判别模型的目标是根据输入数据直接预测其类别或属性。然而，生成模型则关注于从潜在的数据分布中学习并生成新的、看起来像来自同一分布的样本。由于概率计算的复杂性，深度生成模型在应用中受到了限制，而GAN的出现解决了这一问题。 2. GAN的基本结构与工作原理 GAN由两个主要组件构成：生成器G和判别器D。生成器G接收一个随机噪声向量z作为输入，并尝试将其转化为与真实数据相似的样本。另一方面，判别器D接受一个图像x作为输入，然后输出x属于真实数据的概率。训练过程中，D的目标是正确区分真实数据和G生成的假数据，而G则试图欺骗D，使其无法分辨真实与伪造的差异。 3. 对抗训练过程 GAN的训练是一个动态博弈的过程。在每一轮迭代中，D和G会交替进行优化。D尝试最大化其区分真实与伪造样本的能力，而G则试图最小化D区分它们的能力。随着训练的进行，G生成的样本质量逐渐提高，直到D无法准确地判断G生成的样本是真是假，即D(G(z))接近0.5。此时，G已达到足够高的生成能力，能够产出难以辨别的假图像。 4. 假币制造者与警察的比喻为了形象地解释GAN的工作机制，Goodfellow提出了假币制造者和警察的比喻。生成器G如同假币制造者，不断改进其技术，制造更逼真的假币，而判别器D则扮演警察的角色，试图识别假币。随着两者技能的提升，最终假币制造者的水平将达到使警察无法区分的程度，这表示GAN已经成功地学会了数据的分布。 5. 应用与挑战 GANs已经在许多领域展现出巨大的潜力，如图像合成、视频生成、图像修复、风格迁移等。然而，GANs的训练过程并不稳定，容易出现模式塌陷、训练不收敛等问题，这也是研究者们持续关注和解决的重点。生成式对抗网络通过独特的对抗训练机制，突破了深度生成模型的局限，成为生成新样本和模拟现实世界数据的强大工具。尽管面临挑战，但其在计算机视觉及其他领域的广泛应用表明了其重要性和价值。

1. 前言

在GAN被提出之前，深度学习在计算机视觉领域最令人瞩目的成果基本上都是判

别模型（Discriminative models），如图像分类，目标识别等。但其实故事的

另一半是深度生成模型（Deep Generative Models）。生成模型的影响力一直很

小，主要原因是对深度神经网络（如CNN）使用最大似然估计时，遇到了棘手的

概率计算问题，而GAN的提出则巧妙的绕过了这个问题。具体分析我们会在稍后

给出。

2. GAN的直观介绍

GAN是Ian Goodfellow提出的使用对抗过程来获得生成模型的新框架。生成对抗

网络主要由两个部分组成，一个是生成器G(Generator)，另一个是判别器

D(discriminator)。

生成器G的作用是尽量去拟合(cover)真实数据分布，生成以假乱真的

图片。它的输入参数是一个随机噪声z，G(z)代表其生成的一个样本(fake

data)。

判别器D的作用是判断一张图片是否是“真实的”，即能判断出一张

图片是真实数据(trainingdata)还是生成器G生成的样本(fakedata)。它

的输入参数是x，x代表一张图片，D(x)代表x是真实图片的概率。

具体过程：

(1) 对于从训练数据中取样出的真实图片x，判别器D希望D(x)的输出值接近1，

即判定训练数据为真实图片。

(2) 给定一个随机噪声z，判别器D希望D(G(z))的输出值接近0，即认定生成器G

生成的图片是假的；而生成器G希望D(G(z))的输出值接近1，即G希望能够欺骗

D，让D将生成器G生成的样本误判为真实图片。这样G和D就构成了博弈的状态。

(3) 在博弈的过程中，生成器G和判别器D都不断的提升自己的能力，最后达到一

个平衡的状态。G可以生成足以“以假乱真”的图片G(z)。对于D来说，它难以判

定G生成的图片究竟是不是真实的，因此D(G(z)) = 0.5。这样我们的目的就达成

了：我们得到了一个生成式的模型G，它可以用来生成真实图片。

下载后可阅读完整内容，剩余6页未读，立即下载

开眼旅行精选

粉丝: 19
资源: 327

深度学习新篇章：生成式对抗网络(GAN)解析

微信小程序-模仿知乎.rar

微信小程序练手项目-知乎日报(完整代码)

知乎-刘申-知乎环境治理.pdf

Android--知乎App

Axure-UI-知乎主页.rp

知乎-郭静-知乎移动端版本迭代流程演进.pdf

20210625-国元国际-知乎-ZH.US-学而时习之，就上知乎.pdf

Axure-UI-知乎登陆框.rp

读博心得分享 - 知乎1

微信小程序-知乎日报1.rar

最新资源