GAN应用解析：从黑白照片上色到图像转换

版权申诉

90 浏览量更新于2024-07-03 收藏 9.94MB PPTX 举报

本次公开课程主要探讨了生成式对抗网络（GAN）在黑白照片上色的应用，通过32页的PPT详细介绍了相关理论和技术。课程涵盖了GAN的基本概念，其在多个领域的应用，以及在黑白照片上色方面的具体实践。正文：生成式对抗网络（GAN）是由Ian Goodfellow等人在2014年的NIPS会议上首次提出的，它是一种深度学习模型，由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器的任务是创造与训练数据相似的新样本，而判别器则试图区分生成器产生的假样本和真实样本。两者在对抗过程中不断优化，使得生成器能够生成更加逼真的数据。在GAN的相关应用中，Domain Translation是一种重要的方向，它涉及到将图像从一个领域转换到另一个领域，例如将黑白照片转换成彩色照片。ICCV 2017年发表的“Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks”论文中提出了一种循环一致的对抗网络，能够在没有配对训练数据的情况下进行图像转换，这在黑白照片上色中有着广泛的应用。风格转换是GAN的另一个关键应用，它可以将一种艺术风格应用到另一图像上，如将照片转换成梵高风格的艺术画。例如，CVPR 2018年的“CartoonGAN - Generative Adversarial Networks for Photo Cartoonization”工作展示了如何将真实照片转化为卡通风格。表情和属性编辑是GAN在人脸处理上的应用，如arXiv上的“AttGAN - Facial Attribute Editing by Only Changing What You Want”论文，该模型可以精确地编辑面部属性，如改变人的眼神、微笑或年龄，而不影响其他特征。视频合成是GAN技术的另一大突破，它能生成连续的动态图像序列。如arXiv上的“Video-to-Video Synthesis”研究，实现了从输入的源视频生成目标视频的能力，这在视频编辑和特效制作中有巨大的潜力。此外，ECCV 2018的“Recycle-GAN - Unsupervised Video Retargeting”利用GAN进行无监督的视频重定向，即在不需标注数据的情况下调整视频内容的尺寸和视角。 GAN在黑白照片上色的应用只是其众多强大功能的一个实例。通过不断的模型改进和创新，GAN已经成为了图像处理、计算机视觉以及人工智能领域的重要工具，不仅在学术界受到广泛关注，在实际应用中也展现出了强大的创造力和实用性。



GAN 的相关应用



Domain

Translation[2] 。



风格转换 [3] 。



表情、属性编辑 [4, 5] 。



视频合成 [6,7] 。

1 NIPS-2014-Generative Adversarial Nets.

2 ICCV-2017-Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks.

3 CVPR-2018-CartoonGAN- Generative Adversarial Networks for Photo Cartoonization.

4 CVPR-2018-StarGAN- Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation.

5 arXiv-AttGAN Facial Attribute Editing by Only Changing What You Want.

6 arXiv-Video-to-Video Synthesis.

7 ECCV-2018-Recycle-GAN-Unsupervised Video Retargeting.

剩余31页未读，继续阅读

passionSnail

粉丝: 460
资源: 7619

GAN应用解析：从黑白照片上色到图像转换

最新资源