深度学习GAN基础：生成器与判别器的博弈

需积分: 0 11 浏览量更新于2024-08-05 收藏 1.14MB PDF 举报

"这篇笔记主要介绍了GAN（生成对抗网络）的基本原理、数学基础以及训练方式，并探讨了GAN在训练过程中存在的问题。笔记内容参考了台大李宏毅老师的机器学习课程，重点阐述了生成器和判别器的角色以及它们如何进行博弈对抗以逼近真实数据分布。" GAN（生成对抗网络）是一种深度学习模型，用于生成与训练数据类似的新样本。在基本介绍中，GAN的核心思想是通过两个神经网络组件——生成器（Generator）和判别器（Discriminator）进行交互学习。生成器从随机噪声（通常为高斯分布）中采样，尝试生成看似真实的样本，而判别器则试图区分生成的样本与真实样本。整个训练过程是一个非合作的零和游戏，即生成器的目标是欺骗判别器，而判别器的目标是正确识别真实和虚假样本。数学原理部分，GAN的目标函数涉及了生成器G和判别器D的优化问题。G试图生成数据分布P_g，以尽可能接近真实数据分布P_data。D是一个二分类器，输出表示输入样本属于真实数据的概率。GAN的目标是找到最佳的G，使得D无法区分生成样本与真实样本。这可以通过最大化判别器的错误率（即生成样本被判为真实样本的概率）来实现。目标函数通常表达为V(G,D)的形式，其优化涉及对D的损失函数进行求导，以更新生成器G的参数，使其生成的样本更难以被D识别。训练方式上，GAN的训练是一个交替优化的过程，即在固定生成器的情况下训练判别器，然后在固定判别器的情况下训练生成器。这个迭代过程持续进行，直到达到一个纳什均衡点，此时生成器生成的样本质量足够高，以至于判别器无法准确区分。然而，GAN在训练过程中存在一些问题，例如模式塌陷（模式崩溃，生成器仅学习到少数几种模式）、训练不稳定、梯度消失或爆炸，以及训练时间较长等。这些问题限制了GAN在实际应用中的效果，研究人员正在探索各种解决方案，如Wasserstein距离、改进的训练策略和正则化技术，以提高GAN的性能和稳定性。 GAN是一种强大的工具，能够生成逼真的图像、音频和文本，广泛应用于计算机视觉、图像编辑、艺术创作和数据增强等领域。尽管存在挑战，但GAN的研究和应用仍在不断发展，持续推动着生成模型的进步。

GAN的基本原理介绍

0. 声明

这份学习笔记大量参考了台大李宏毅老师2017年春季《Machine Learning and having it deep and structured》

课程中GAN的部分，课程链接如下：

http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS17.html

1. 基本介绍

通常我们在做generation的时候，会期望生成的数据分布尽可能的接近真实的数据分布。如果用

KL散度来来衡量，那么我们的目标就是找到一组参数使得

怎么得到呢？混合高斯分布是一个可行的方法，我们可以调整高斯分布的均值和方差等参数，来让KL散度

最小。但高斯混合能表示的分布数目是有限的，我们希望使用一个更一般化的分布，这时候就要借助神经网络来实

现。 GAN就是通过NN来生成这样一个更加泛化的分布。

GAN由两部分组成：生成器 (Generator)和判别器 (Discriminator)。生成器的输入从一个标准高斯分布中采

样得到，输出就是生成的分布。判别器负责衡量生成分布和原始分布之间的差异，鉴别输入是机器生成的结果还

是真实的数据。GAN的训练过程就是生成器和判别器博弈对抗的过程，我们最终的目的是希望判别器不能分辨其输

入到底是生成的还是真实的，从而得到一个很接近真实分布的生成结果。

2. 数学原理

下面我们将从理论上来分析GAN是如何做到数据分布生成的。首先给出GAN的目标函数：

其中就是我们要寻找的生成器，是一个具有如下形式的函数：

我们可以借助图示来更好地理解GAN目标函数中的操作。

给定一个生成器，我们可以得到不同形式的。显然可以有无穷多个，相应的也有无穷多个。

为简单起见，这里我们只取其中的三个：

下载后可阅读完整内容，剩余7页未读，立即下载

我只匆匆而过

粉丝: 20
资源: 316

深度学习GAN基础：生成器与判别器的博弈

GAN学习笔记

级联型GaN开关管基础知识学习笔记

enconder_decoder_vs_gan:该存储库将python笔记本中用于实验的文件进行了比较，以比较编码解码器网络，GAN网络和GAN循环

StackGan笔记1

Tenserflow笔记本

新材料GaN专题报告：小米发布的GaN快充是什么？.rar

[原创]机器学习与神经网络学习笔记1

GAN Step By Step -- GSBS，顾名思义，我希望我自己能够一步一步的学习GAN。.zip

TI最新可驱动GAN MOS资料

深度学习笔记5.43

最新资源