使用重建损失提升生成对抗网络性能

3 下载量 200 浏览量 更新于2024-07-15 收藏 1.53MB PDF 举报
"Improved Generative Adversarial Networks with Reconstruction Loss" 本文提出了一种改进的生成对抗网络(GAN)模型,旨在解决传统GAN在模式丢失和训练不稳定性方面的问题。作者引入了一个名为“重建损失”的正则化策略,该策略利用鉴别器(Discriminator)学到的视觉特征来帮助生成器(Generator)生成更高质量的图像。 生成对抗网络是一种深度学习框架,由两个神经网络组成:生成器和鉴别器。生成器尝试生成与真实数据难以区分的新样本,而鉴别器的任务是区分这些生成样本与真实数据。然而,GAN在训练过程中可能会遇到模式塌陷问题,即生成器仅能学习到数据分布的一小部分,导致生成样本的多样性不足。 在本文中,研究者提出将重建损失加入到GAN的目标函数中。具体做法是,生成器不仅需要生成逼真的图像,还需要基于鉴别器的特征来重建真实数据。这一机制提供了明确的指导,促使生成器朝向更接近真实数据的解决方案发展。重建损失帮助生成器更好地理解鉴别器学到的高级特征,从而提高生成图像的质量和多样性。 实验证明,这种改进的方法在多个数据集上都有效。无论是在简单的深度卷积生成对抗网络(DCGAN)架构还是更复杂的残差网络(ResNet)架构上,都观察到了性能提升。此外,该方法还能与其他正则化技术(如梯度惩罚)结合,以进一步优化各种GAN模型的性能。 文章由李艳春、肖楠峰和欧阳万利共同完成,并已被《神经计算》期刊接收发表。这个未编辑的接受稿提供了初步的研究成果,最终的出版版本可能会经过校对、排版和审阅证明后发布。这个早期版本的论文提醒读者,可能存在尚未发现的错误,但所有与该期刊相关的法律免责声明仍然适用。 该研究通过引入重建损失,为解决生成对抗网络的训练问题提供了一种新的有效途径,这对于图像生成和深度生成模型的领域具有重要的理论和实践意义。