Question 1

Qu'est-ce qu'un modèle de diffusion ?

Accepted Answer

Un modèle de diffusion est un type d'IA générative qui crée des images en apprenant à inverser un processus d'ajout de bruit. En partant de bruit aléatoire, il supprime progressivement le bruit étape par étape jusqu'à ce qu'une image cohérente émerge, guidée par un prompt textuel ou une autre entrée de conditionnement.

Question 2

Pourquoi les modèles de diffusion sont-ils si largement utilisés aujourd'hui ?

Accepted Answer

Les modèles de diffusion produisent des sorties de haute qualité et diversifiées, sont plus stables à entraîner et meilleurs pour suivre le conditionnement textuel que les architectures génératives antérieures comme les GANs. Leur capacité à s'adapter au calcul et à gérer une large gamme d'entrées de conditionnement en a fait l'architecture dominante de la génération moderne d'images et de vidéos par IA.

Question 3

Qu'est-ce qu'un modèle de diffusion latente ?

Accepted Answer

Un modèle de diffusion latente opère dans une représentation compressée de l'image appelée espace latent plutôt que directement sur les pixels en pleine résolution. Cela réduit considérablement les exigences de calcul tout en maintenant la qualité de sortie, et c'est l'approche utilisée par Stable Diffusion et de nombreux autres systèmes de génération d'images de production.

Question 4

Comment fonctionne le conditionnement textuel dans les modèles de diffusion ?

Accepted Answer

Un encodeur de texte convertit le prompt écrit en une représentation numérique fournie au réseau de débruitage à chaque étape, guidant la direction dans laquelle le processus de débruitage doit aller pour produire une image cohérente avec le prompt plutôt qu'une image statistiquement plausible quelconque.

Question 5

Que sont les étapes de débruitage et pourquoi sont-elles importantes ?

Accepted Answer

Les étapes de débruitage sont les itérations individuelles de suppression de bruit que le modèle de diffusion effectue pour produire une image finale. Plus d'étapes donnent au modèle plus d'opportunités d'affiner l'image, améliorant généralement la qualité et le détail, mais chaque étape nécessite du temps de calcul. Des nombres d'étapes plus bas génèrent plus rapidement mais peuvent produire des résultats moins raffinés.

Question 6

Quels outils de génération d'images utilisent des modèles de diffusion ?

Accepted Answer

La plupart des principaux outils text-to-image utilisent des architectures de modèles de diffusion, dont Stable Diffusion, DALL-E 2, DALL-E 3, Midjourney et Imagen. La plupart des modèles contemporains de génération vidéo par IA sont également basés sur la diffusion ou fortement influencés par les principes des modèles de diffusion.

Question 7

Quelle est la différence entre les modèles de diffusion et les GANs ?

Accepted Answer

Les GANs utilisent des réseaux générateur et discriminateur concurrents entraînés de manière adversariale et étaient l'approche dominante avant les modèles de diffusion. Les GANs sont sujets à l'instabilité et à une diversité limitée. Les modèles de diffusion sont plus stables à entraîner, produisent des sorties plus diversifiées et gèrent le conditionnement textuel plus fiablement, c'est pourquoi ils ont remplacé les GANs pour la plupart des applications de génération de haute qualité.

Question 8

Les modèles de diffusion fonctionnent-ils pour la vidéo comme pour les images ?

Accepted Answer

Oui. Les modèles de diffusion vidéo étendent l'architecture pour inclure la dimension temporelle, générant des séquences cohérentes d'images plutôt que des images individuelles. La plupart des systèmes modernes de génération vidéo par IA sont construits sur ou significativement influencés par les principes des modèles de diffusion appliqués aux séquences temporelles.

Modèles de diffusion

Qu’est-ce que Modèles de diffusion ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ