Question 1

Qu'est-ce que DALL-E 2 ?

Accepted Answer

DALL-E 2 est le modèle text-to-image de deuxième génération d'OpenAI, sorti en avril 2022. Il produit des images de plus haute résolution que le DALL-E original grâce à une architecture basée sur la diffusion et ajoute des capacités d'inpainting, d'outpainting et de variation d'images.

Question 2

En quoi DALL-E 2 diffère-t-il du DALL-E original ?

Accepted Answer

DALL-E 2 est passé d'une architecture autorégressive de transformeur à un modèle de diffusion, produisant des images plus nettes à plus haute résolution. Il a également ajouté des capacités d'édition d'images, dont l'inpainting et l'outpainting, que l'original ne proposait pas.

Question 3

Qu'est-ce que l'inpainting dans DALL-E 2 ?

Accepted Answer

L'inpainting permet aux utilisateurs de sélectionner une région dans une image existante, puis de décrire en texte ce qui devrait remplacer cette région. Le modèle génère un nouveau contenu pour remplir la zone sélectionnée tout en correspondant au style et au contexte environnants de l'image.

Question 4

Qu'est-ce que l'outpainting dans DALL-E 2 ?

Accepted Answer

L'outpainting étend une image existante au-delà des limites de sa toile d'origine, générant un nouveau contenu qui prolonge le style, l'éclairage et le contexte visuel de l'image originale dans la zone élargie.

Question 5

Quelle résolution DALL-E 2 génère-t-il ?

Accepted Answer

DALL-E 2 génère des images à 1024x1024 pixels comme résolution maximale, une amélioration significative par rapport au DALL-E original qui produisait des sorties de plus faible résolution.

Question 6

DALL-E 2 est-il encore utilisé aujourd'hui ?

Accepted Answer

DALL-E 2 a été largement supplanté par DALL-E 3 pour la plupart des tâches de génération, car DALL-E 3 offre une bien meilleure adhérence au prompt et une meilleure qualité d'image. Cependant, les capacités d'inpainting et d'outpainting de DALL-E 2 peuvent encore être accessibles pour des workflows d'édition spécifiques.

Question 7

Comment DALL-E 2 gère-t-il la compréhension des prompts ?

Accepted Answer

DALL-E 2 utilise un système d'alignement texte-image basé sur CLIP qui relie la compréhension du langage à la génération de contenu visuel. Il gère une large gamme de types de prompts mais présente une adhérence aux prompts moins précise que DALL-E 3, en particulier pour les instructions compositionnelles complexes.

Question 8

Quelles fonctionnalités de sécurité DALL-E 2 inclut-il ?

Accepted Answer

DALL-E 2 inclut des filtres de contenu qui empêchent la génération de contenu nuisible, explicite ou contrefait. Il restreint la génération de visages de personnes réelles dans certains contextes et applique des filtres conçus pour prévenir les usages abusifs, ces garde-fous étant imposés au niveau de l'API.

DALL-E 2

Qu’est-ce que DALL-E 2 ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ