Question 1

Qu'est-ce que DALL-E ?

Accepted Answer

DALL-E est le modèle original de génération text-to-image d'OpenAI, sorti en janvier 2021. Il a démontré qu'une IA entraînée sur des paires image-texte pouvait générer de nouvelles images cohérentes à partir de descriptions en langage naturel, y compris des combinaisons inédites de concepts absents des données d'entraînement.

Question 2

Qui a créé DALL-E ?

Accepted Answer

DALL-E a été développé par OpenAI. Le nom combine des références à Salvador Dalí et au personnage Pixar WALL-E, reflétant les ambitions créatives et technologiques du projet.

Question 3

En quoi DALL-E diffère-t-il de DALL-E 2 et DALL-E 3 ?

Accepted Answer

Le DALL-E original utilisait une architecture autorégressive basée sur les transformeurs et produisait des sorties de plus faible résolution. DALL-E 2 est passé à une approche basée sur la diffusion pour une qualité considérablement améliorée. DALL-E 3 a ajouté des avancées majeures en matière d'adhérence au prompt et de rendu du texte. Chacun est un modèle distinct avec des capacités différentes.

Question 4

Quelle architecture utilise DALL-E ?

Accepted Answer

Le DALL-E original utilisait une architecture de transformeur qui traitait conjointement les tokens d'image et de texte sous forme de séquence commune. DALL-E 2 et DALL-E 3 utilisent des architectures basées sur la diffusion, devenues l'approche dominante dans la génération text-to-image.

Question 5

DALL-E est-il open source ?

Accepted Answer

Non. DALL-E et ses successeurs sont des modèles propriétaires développés et contrôlés par OpenAI. Ils sont accessibles via l'API et les produits intégrés d'OpenAI plutôt que disponibles sous forme de poids de modèle téléchargeables.

Question 6

Pourquoi DALL-E a-t-il été important lors de sa sortie ?

Accepted Answer

DALL-E a été important parce qu'il a été l'un des premiers systèmes d'IA publiquement démontrés capable de générer à grande échelle des images cohérentes et créatives à partir de descriptions ouvertes en langage naturel. Il a suscité un intérêt généralisé pour le potentiel créatif de l'IA générative et a établi le langage naturel comme interface créative pour la génération d'images.

Question 7

À quoi sert DALL-E aujourd'hui ?

Accepted Answer

Le DALL-E original a aujourd'hui une importance principalement historique et éducative. Les workflows créatifs actuels utilisent généralement DALL-E 3, intégré à ChatGPT et aux outils créatifs Microsoft, ou des modèles tiers qui ont surpassé l'original en qualité et en capacité.

Question 8

Quels types d'images le DALL-E original pouvait-il générer ?

Accepted Answer

Le DALL-E original pouvait générer une large gamme d'images à partir de prompts textuels, y compris des combinaisons conceptuelles inédites comme des objets sous des formes ou dans des contextes inhabituels. Ses sorties étaient de plus faible résolution et de moins bonne cohérence que les modèles actuels mais démontraient le principe central de la généralisation compositionnelle du langage vers l'imagerie.

DALL-E

Qu’est-ce que DALL-E ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ