Question 1

GAN 是什么的缩写？

Accepted Answer

GAN 是生成对抗网络（Generative Adversarial Network）的缩写。其中的「对抗」指驱动训练过程的两个网络（生成器与判别器）之间的竞争关系。

Question 2

谁发明了 GAN？

Accepted Answer

GAN 由伊恩·古德费洛及其同事在蒙特利尔大学于 2014 年的一篇论文中提出。据称这一思想是在一次酒馆讨论中构想出来的，并在同一晚被开发成一个可运行的原型。

Question 3

GAN 如今仍在使用吗？

Accepted Answer

是的，尽管扩散模型已在图像与视频生成质量上成为主导架构。GAN 仍被广泛用于实时视频增强、人脸生成、ESRGAN 等上采样工具，以及推理速度是优先项的应用中。

Question 4

GAN 中的模式坍缩是什么？

Accepted Answer

模式坍缩是一种训练失败，生成器学会只产出能可靠骗过判别器的狭窄范围输出，而非训练数据的完整多样性。例如，一个人脸 GAN 可能坍缩到只生成少数几张相似的人脸。它是 GAN 训练的关键挑战之一。

Question 5

GAN 与扩散模型有何不同？

Accepted Answer

GAN 通过生成器网络的单次传递产出输出，使其快速。扩散模型通过多步迭代去噪产出输出，速度较慢但通常产出更多样、更高质量的结果。大多数前沿生成工具如今都使用扩散模型。

Question 6

什么是 StyleGAN？

Accepted Answer

StyleGAN 是由 NVIDIA 开发的极具影响力的 GAN 架构，它引入了对生成图像属性的基于风格的控制，为人脸与人像生成实现了前所未有的质量与控制。它历经多个版本（StyleGAN2、StyleGAN3），仍是被研究最多的 GAN 变体之一。

Question 7

GAN 能像生成图像一样生成视频吗？

Accepted Answer

可以。视频 GAN 将对抗训练框架扩展到时间序列，训练生成器产出流畅的多帧片段。例子包括 VideoGAN 与 MoCoGAN。然而，GAN 的视频生成质量最终被基于扩散的视频模型所超越。

生成对抗网络（GAN）

生成对抗网络（GAN）是什么？