机器学习小组作业：深度学习在图像处理的应用探索

需积分: 0 24 浏览量更新于2024-08-04 收藏 32KB DOCX 举报

"本次机器学习小组作业要求每个小组10人协作，针对特定领域（如Text-To-Image Synthesis）完成一篇大报告和三项代码调试任务。报告需要基于过去两年内的顶级会议论文（如CVPR、ICCV、ECCV等）进行编写，至少引用5篇相关论文，涵盖论文的动机、方法、实验细节和结果。同时，鼓励小组成员在GitHub上寻找高评分项目进行代码调试。作业涉及的三个主要领域包括Image-to-Image Translation、Text-To-Image Synthesis和Image Inpainting。" 在机器学习领域，Image-to-Image Translation是一种技术，它允许我们通过深度学习模型将一种类型的图像转换为另一种类型。其中，代表性论文如《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks》（CycleGAN）引入了循环一致性的概念，使得在无配对数据的情况下也能进行图像转换。另一篇论文《Image-to-Image Translation with Conditional Adversarial Networks》（Pix2Pix）则利用条件对抗网络，实现了从输入图像到目标图像的精确映射。 Text-To-Image Synthesis是另一项关键任务，它的目标是根据文本描述生成逼真的图像。例如，《StackGAN++: Realistic Image Synthesis with Stacked Generative Adversarial Networks》和《StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks》提出了StackGAN系列模型，通过多阶段生成过程提高图像的真实感。而《Generative Adversarial Text-to-Image Synthesis》则是首次将生成对抗网络应用于文本到图像的合成。AttnGAN（《AttnGAN: Fine-Grained Text-to-Image Generation with Attentional Generative Adversarial Networks》）通过注意力机制实现了细粒度的控制，生成更符合文本描述的图像。《Controllable Text-to-Image Generation》则允许用户在生成过程中进行一定程度的控制。 Image Inpainting是图像修复或填充技术，用于恢复或创造图像中缺失的部分。虽然这部分没有列出具体的代表论文，但常见的方法通常涉及深度学习模型，如利用卷积神经网络（CNNs）和对抗性训练来生成与原始图像无缝融合的新内容。在完成这个作业时，学生不仅需要深入理解这些前沿研究，还需要具备编程和调试能力，能够实现并运行相关的代码。这将是一个综合性的学习和实践过程，旨在提升学生在机器学习领域的理论知识和实际操作技能。

作业: 每个小组 10 位成员合作完成对应序号领域（小组序号为 2 的

对应下面的 Text-To-Image Synthesis）的一篇大报告和 3 份代码调

试。每个领域下面都有相应的代表论文，同学们可以根据这些论文对

相应的领域有所了解。

注意：大报告需要包含至少 5 篇来自最近两年的顶会论文（例如 CVPR，

ICCV，ECCV，ICML，ICLR，KDD，ACL，NIPS，NAACL，AAAI，IJCAI，

EMNLP，SIGIR），格式自行设计，报告内容需总结论文的动机，方法，

实验细节和结果。代码尽可能的去找 github 高星的项目进行调试。

1. Image-To-Image Translation

代表论文：《Unpaired Image-to-Image Translation using Cycle-Consistent

Adversarial Networks》《Image-to-Image Translation with Conditional Adversarial

Networks》《Toward Multimodal Image-to-Image Translation》《DualGAN:

Unsupervised Dual Learning for Image-to-Image Translation》《StarGAN: Unified

Generative Adversarial Networks for Multi-Domain Image-to-Image Translation》

2. Text-To-Image Synthesis

代表论文：《StackGAN++: Realistic Image Synthesis with Stacked Generative

Adversarial Networks》《StackGAN: Text to Photo-realistic Image Synthesis with

Stacked Generative Adversarial Networks》《Generative Adversarial Text to Image

Synthesis》《AttnGAN: Fine-Grained Text to Image Generation with Attentional

Generative Adversarial Networks》《Controllable Text-to-Image Generation》

3. Image Inpainting

代表论文：《Deep Image Prior》《EdgeConnect: Generative Image Inpainting with

Adversarial Edge Learning》《SC-FEGAN: Face Editing Generative Adversarial

Network with User's Sketch and Color》《Free-Form Image Inpainting with Gated

Convolution》《Generative Image Inpainting with Contextual Attention》

4. DeepFake

代表论文：《 DeepFakes and Beyond: A Survey of Face Manipulation and Fake

Detection 》《 Fake Face Detection via Adaptive Residuals Extraction Network 》

《 Deepfake Forensics Using Recurrent Neural Networks 》《 Detecting Deepfakes

with Metric Learning》《Deepfake Video Forensics based on Transfer Learning》

5. Image Restoration

下载后可阅读完整内容，剩余9页未读，立即下载

練心

粉丝: 27

机器学习小组作业：深度学习在图像处理的应用探索

机器学习小组作业.ipynb

同济大学机器学习小组作业.zip

机器学习小组作业.zip课设&实训&大作业

机器学习小组作业-汉字书法识别python源码+文档说明(高分课程设计)

同济大学机器学习小组作业解析

机器学习课后作业西邮

电子科技大学2022级研究生课程《机器学习》，包含课件、实验、小组作业、平时作业和电子书。.zip

利用svm进行对银杏树的分类，小组第二次机器学习作业.zip

MSDS-机器学习1-小组5

电子科技大学2022级研究生课程《机器学习》，包含课件、实验、小组作业、平时作业和电子书(毕设&课设&实训&大作业&竞赛&项目)

最新资源