Question 1

Que signifie GAN ?

Accepted Answer

GAN signifie Generative Adversarial Network ( réseau antagoniste génératif ). Le terme 'adversarial' renvoie à la relation compétitive entre les deux réseaux ( le générateur et le discriminateur ) qui pilote le processus d'entraînement.

Question 2

Qui a inventé les GAN ?

Accepted Answer

Les GAN ont été introduits par Ian Goodfellow et ses collègues de l'Université de Montréal dans un article de 2014. L'idée aurait été conçue lors d'une discussion dans un pub et développée en prototype fonctionnel le soir même.

Question 3

Les GAN sont-ils encore utilisés aujourd'hui ?

Accepted Answer

Oui, même si les modèles de diffusion ont pris le dessus comme architecture dominante pour la qualité de génération d'image et de vidéo. Les GAN restent largement utilisés dans l'amélioration vidéo en temps réel, la génération de visages, les outils d'upscaling comme ESRGAN et les applications où la vitesse d'inférence est une priorité.

Question 4

Qu'est-ce que le mode collapse dans un GAN ?

Accepted Answer

Le mode collapse est un échec d'entraînement où le générateur apprend à ne produire qu'une plage étroite de sorties qui trompent de manière fiable le discriminateur, plutôt que la pleine diversité des données d'entraînement. Par exemple, un GAN de visages pourrait s'effondrer en ne générant que quelques visages semblables. C'est l'un des défis clés de l'entraînement des GAN.

Question 5

En quoi les GAN diffèrent-ils des modèles de diffusion ?

Accepted Answer

Les GAN génèrent une sortie en une seule passe à travers le réseau générateur, ce qui les rend rapides. Les modèles de diffusion génèrent les sorties en débruitant de manière itérative sur de nombreuses étapes, ce qui est plus lent mais produit généralement des résultats plus diversifiés et de meilleure qualité. La plupart des outils génératifs de pointe utilisent désormais des modèles de diffusion.

Question 6

Qu'est-ce que StyleGAN ?

Accepted Answer

StyleGAN est une architecture GAN très influente développée par NVIDIA qui a introduit un contrôle de type 'style' sur les attributs des images générées, permettant une qualité et un contrôle sans précédent pour la génération de visages et de portraits. Elle a connu plusieurs versions (StyleGAN2, StyleGAN3) et reste l'une des variantes de GAN les plus étudiées.

Question 7

Les GAN peuvent-ils générer de la vidéo aussi bien que des images ?

Accepted Answer

Oui. Les GAN vidéo étendent le cadre d'entraînement antagoniste aux séquences temporelles, en entraînant le générateur à produire des clips multi-images cohérents. Les exemples incluent VideoGAN et MoCoGAN. Cependant, la qualité de la génération vidéo par GAN a finalement été dépassée par les modèles vidéo basés sur la diffusion.

Réseau antagoniste génératif (GAN)

Qu’est-ce que Réseau antagoniste génératif (GAN) ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ