Génération d'images

Ideogram 4.0

par Ideogram

Le modèle d'image à poids ouverts d'Ideogram. Texte dans l'image, mise en page contrôlée et sortie 2K.

Ideogram 4.0

Fonctionnalités clés

Spécifications techniques

Ouverts

Poids ouverts sur Hugging Face et GitHub, sous licence commerciale

0.97 OCR

Score OCR anglais X-Omni pour le texte rendu dans l'image

16 couleurs

Conditionnez la sortie sur jusqu'à 16 couleurs hex

Jusqu'à 2K

256 à 2048 px par côté, formats d'image flexibles

Cas d'utilisation

Affiches et emballages

Du design où le titre, l'accroche et les petites mentions doivent tous se lire. Le texte sort lisible, pas en formes.

Campagnes multilingues

Localisez un visuel par marché en changeant le texte par langue, pendant que mise en page et palette restent fixes.

Visuels fidèles à la marque

Donnez la palette hex de la marque au prompt et chaque génération reste dans la charte, du post au bandeau.

Formats inhabituels

Un seul jeu de poids couvre vignettes carrées, panoramique, bannières ultra-larges 2048 par 768 et en-têtes sociaux.

Génération programmatique

Les prompts JSON sont faits pour le code. Générez catalogues ou variantes d'annonces par script, chaque élément validé.

Pipelines auto-hébergés

Les équipes qui ne peuvent pas passer par une API tierce affinent les poids et les exécutent dans leur infrastructure.

Exemples de prompts

Affiche d'événement

Affiche d'événement

Affiche de festival de jazz, grand titre en haut, programmation lisible en bas

Edit prompt
Emballage

Emballage

Face avant d'un sachet de café, nom du torréfacteur en serif, lumière du matin

Edit prompt
Palette de marque

Palette de marque

Bannière de lancement produit fidèle à une palette sarcelle, sable et rouille

Edit prompt
Bannière ultra-large

Bannière ultra-large

Bannière de site ultra-large, crête de montagne à l'aube, titre à gauche

Edit prompt
Enseigne multilingue

Enseigne multilingue

Devanture de Tokyo avec enseignes japonaises exactes, pluie fine, lueur du soir

Edit prompt
Couverture de magazine

Couverture de magazine

Couverture de magazine d'architecture, titre en haut, accroches sur la droite

Edit prompt

Tarifs simples

Commencez gratuitement dès aujourd'hui, avec la possibilité de mettre à niveau ou d'annuler à tout moment.

Basic

$0/ mois
facturé comme $0 par an

500 mensuel crédits

1 utilisateur uniquement

Tous les modèles

Workflows

Standard

$0/ mois
facturé comme $0 par an

2800 mensuel crédits

1 utilisateur uniquement

Tous les modèles

Workflows

Pro

$0/ mois
facturé comme $0 par an

6000 partagé mensuel crédits

1 utilisateur

+ jusqu'à 4 plus à un coût supplémentaire

Tous les modèles

Workflows

Pro Max

$0/ mois
facturé comme $0 par an

24000 partagé mensuel crédits

1 utilisateur

+ jusqu'à 9 plus à un coût supplémentaire

Tous les modèles

Workflows

Enterprise

Pour des limites plus élevées

Personnalisé

conditions de tarification et de facturation

Crédits illimités
Limites de sièges personnalisées
Tous les modèles
Workflows
Pricing Gradient

Free

For playing around

$0

forever free

Jusqu'à 20 crédits
1 utilisateur uniquement
Modèles limités
Workflows

Questions fréquentes

Qu'est-ce qu'Ideogram 4.0 ?
Ideogram 4.0 est un modèle texte-vers-image à poids ouverts de 9,3 milliards de paramètres, signé Ideogram et publié le 3 juin 2026. Il mise sur un rendu exact du texte dans l'image, un contrôle de composition par bounding box, le conditionnement par palette de couleurs et une sortie jusqu'en 2K, avec des poids téléchargeables sous licence commerciale.
Ideogram 4.0 est-il open source ?
Ideogram 4.0 est à poids ouverts plutôt que pleinement open source. Les poids, le code d'inférence et le guide de prompting sont publics sur Hugging Face et GitHub, et les déploiements commerciaux sont couverts par une licence qui suit votre échelle. Vous pouvez télécharger le modèle, l'affiner et l'auto-héberger.
Quelle est la qualité du rendu de texte d'Ideogram 4.0 ?
Le rendu de texte est la force phare du modèle. Ideogram annonce un score de 0,97 au benchmark OCR anglais X-Omni, qui mesure si le texte d'une image générée est réellement lisible et bien orthographié, et le modèle gère le texte multilingue aussi bien que l'anglais.
Comment fonctionne le contrôle de mise en page d'Ideogram 4.0 ?
Vous attachez des bounding box aux éléments du prompt, chacune couplée à une description en langage courant, et le modèle place ces objets dans les zones demandées. Ideogram annonce un score mIoU de 0,69 au benchmark de mise en page 7Bench, qui mesure à quel point les objets générés tiennent dans leurs boîtes.
Qu'est-ce que le prompting JSON structuré ?
Au lieu d'une longue phrase, un prompt Ideogram 4.0 est un objet JSON : une description de scène, un bloc de style pour l'esthétique et la lumière, des éléments individuels avec bounding box optionnelle, des éléments de texte typés avec la chaîne exacte à rendre, et une palette optionnelle de 16 couleurs hex maximum. Le pipeline de référence valide chaque prompt contre le schéma avant de générer.
Quelles résolutions Ideogram 4.0 prend-il en charge ?
Ideogram 4.0 génère de 256 à 2048 pixels par côté avec des formats d'image flexibles. Un seul jeu de poids couvre le carré 1024, le paysage et le portrait 1536 par 1024, le panoramique 1920 par 1088, l'ultra-large 2048 par 768, les fonds d'écran de téléphone et les bannières sociales 1584 par 396.
Que sont les presets Turbo, Default et Quality ?
Ce sont trois presets d'échantillonnage qui échangent vitesse contre finition : Turbo exécute 12 étapes de débruitage, Default 20 et Quality 48. Un flux courant consiste à esquisser les compositions en Turbo, puis à relancer le prompt retenu en Quality pour l'asset final.
Puis-je exécuter Ideogram 4.0 sur mon propre matériel ?
Oui. Ideogram publie des checkpoints quantifiés fp8 et nf4 qui tiennent sur un seul GPU de 24 Go, aux côtés des poids complets et du code d'inférence. Les équipes peuvent aussi affiner le modèle sur leurs propres données de marque ou de produit et le déployer dans leur propre environnement.
Comment Ideogram 4.0 se compare-t-il à GPT Image 2 ?
Sur le classement ELO de préférence des designers publié par Ideogram, Ideogram 4.0 obtient 1062, deuxième derrière GPT Image 2, propriétaire, à 1141, et devant tous les autres modèles à poids ouverts. La différence pratique est l'accès : GPT Image 2 n'existe que par API, tandis qu'Ideogram 4.0 se télécharge, s'affine et s'auto-héberge.