解决Keras GAN训练loss停滞Accuracy为0.5的策略

26 浏览量更新于2023-03-03 2 收藏 74KB PDF 举报

本文主要针对Keras中GAN（Generative Adversarial Networks）训练过程中遇到的一个常见问题——损失(loss)保持不变而accuracy始终为0.5，提供了深入的解决方案和实用建议。GAN训练中，关键的损失函数有两个：BinaryCrossEntropy和CategoricalCrossEntropy。 BinaryCrossEntropy（二元交叉熵）主要用于二分类问题，但也适用于多分类问题，通常需配合sigmoid激活函数使用。在计算时，目标标签需要one-hot编码，其定义公式为：loss(x, z) = -[sum_i(x[i]*log(z[i]) + (1-x[i])*log(1-z[i]))]。在Keras中，可以用def binary_crossentropy(t, o): return -(t * tf.log(o + eps) + (1.0 - t) * tf.log(1.0 - o + eps))实现。 CategoricalCrossEntropy适用于多分类场景，当模型输出层采用softmax激活时。它衡量预测概率分布与实际标签分布之间的差异。对于训练GAN的技巧，作者分享了一些个人经验： 1. **大卷积核和滤波器**：增大卷积核有助于捕捉更多信息，例如在判别器中使用3x3核可能加速收敛。在生成器中，顶层的卷积层应使用较大核，保持图像细节。滤波器数量增加参数量，但过多可能导致过度拟合，一般建议使用128个或更多。 2. **标签翻转（Generated=True）**：这是一个常见的训练策略，即在生成器生成样本后，将真实样本标记为假（Generated=True），以让判别器区分生成样本和真实样本，从而推动生成器的进步。总结来说，解决Keras GAN训练loss停滞、accuracy恒定为0.5的问题，关键在于选择合适的损失函数（如BinaryCrossEntropy和CategoricalCrossEntropy），并注意调整网络结构（特别是卷积核大小和滤波器数量）。同时，理解和运用标签翻转等训练技巧，能有效提高GAN模型的性能。通过这些方法，GAN的训练效果将得到显著提升，为实际应用提供更高质量的生成样本。

解决解决keras GAN训练是训练是loss不发生变化不发生变化,accuracy一直为一直为0.5的的

问题问题

主要介绍了解决keras GAN训练是loss不发生变化,accuracy一直为0.5的问题，具有很好的参考价值，希望对大

家有所帮助。一起跟随小编过来看看吧

1、、Binary Cross Entropy

常用于二分类问题，当然也可以用于多分类问题，通常需要在网络的最后一层添加sigmoid进行配合使用，其期望输出值

（target）需要进行one hot编码，另外BCELoss还可以用于多分类问题Multi-label classification.

定义：

For brevity, let x = output, z = target. The binary cross entropy loss is

loss(x, z) = - sum_i (x[i] * log(z[i]) + (1 - x[i]) * log(1 - z[i]))

对应的代码为：

def binary_crossentropy(t,o):

return -(t*tf.log(o+eps) + (1.0-t)*tf.log(1.0-o+eps))

2、、Categorical cross-entropy

p are the predictions, t are the targets, i denotes the data point and j denotes the class.

适用于多分类问题，并使用softmax作为输出层的激活函数的情况。

补充知识：补充知识：训练训练GAN的一些小贴士的一些小贴士

下面是我认识到自己犯过的一些错误，以及我从中学到的一些东西。所以，如果你是GANs的新手，并没有看到在训练方面取

得很大的成功，也许看看以下几个方面会有所帮助:

1、大卷积核和更多的滤波器、大卷积核和更多的滤波器

更大的卷积核覆盖了前一层图像中的更多像素，因此可以查看更多信息。5x5的核与CIFAR-10配合良好，在判别器中使用3x3

核使判别器损耗迅速趋近于0。对于生成器，你希望在顶层的卷积层有更大的核，以保持某种平滑。在较低的层，我没有看到

改变内核大小的任何主要影响。

滤波器的数量可以大量增加参数的数量，但通常需要更多的滤波器。我在几乎所有的卷积层中都使用了128个滤波器。使用较

少的滤波器，特别是在生成器中，使得最终生成的图像过于模糊。因此，看起来更多的滤波器可以帮助捕获额外的信息，最终

为生成的图像增加清晰度。

2、标签翻转、标签翻转(Generated=True, Real=False)

虽然一开始看起来很傻，但对我有用的一个主要技巧是更改标签分配。

如果你使用的是Real Images = 1，而生成的图像= 0，则使用另一种方法会有所帮助。正如我们将在后面看到的，这有助于在

早期迭代中使用梯度流，并帮助使梯度流动。

3、使用有噪声的标签和软标签、使用有噪声的标签和软标签

这在训练判别器时是非常重要的。硬标签(1或0)几乎扼杀了早期的所有学习，导致识别器非常快地接近0损失。最后，我使用0

到0.1之间的随机数表示0标签(真实图像)，使用0.9到1.0之间的随机数表示1标签(生成的图像)。在训练生成器时不需要这样

做。

此外，增加一些噪音的训练标签也是有帮助的。对于输入识别器的5%的图像，标签被随机翻转。比如真实的被标记为生成

的，生成的被标记为真实的。

4、使用批归一化是有用的，但是需要有其他的东西也是合适的、使用批归一化是有用的，但是需要有其他的东西也是合适的

批归一化无疑有助于最终的结果。添加批归一化后，生成的图像明显更清晰。但是，如果你错误地设置了卷积核或滤波器，或

者识别器的损失很快达到0，添加批归一化可能并不能真正帮助恢复。

5、每次一个类别、每次一个类别

下载后可阅读完整内容，剩余1页未读，立即下载

weixin_38657835

粉丝: 3
资源: 931

解决Keras GAN训练loss停滞Accuracy为0.5的策略

pytorch绘制并显示loss曲线和acc曲线，LeNet5识别图像准确率

解决keras,val_categorical_accuracy:,0.0000e+00问题

keras自定义回调函数查看训练的loss和accuracy方式

Keras YOLO训练错误分析与解决：识别并解决训练过程中的问题

【代码实践】：TensorFlow_Keras实现GAN：新手也能轻松上手

【GAN训练深度分析】：对抗损失与感知损失的对比研究

【Code Practice】: Implementing GAN with TensorFlow_Keras: Beginners Can Also Get Started Easily

Keras模型欠拟合问题：识别症状并提出解决方案，让模型更强大

Keras生成对抗网络：实现生成模型与判别模型的对抗训练

设计并训练自己的生成对抗网络（GAN）模型

最新资源