Gemini Omni
par Google DeepMind
Le premier modèle IA any-to-any de Google. Texte, images, audio et vidéo en entrée. Texte, images, audio et vidéo en sortie.

Fonctionnalités clés
Spécifications techniques
Omni Flash
Premier modèle de la famille Gemini Omni de Google
Video
Sortie image et audio prévues dans la feuille de route Gemini Omni
Up to 10s
Plans Flash limités à 10 secondes au lancement pour élargir l'accès
Text, image, audio, video
Toute combinaison dans un seul prompt Gemini Omni
Voice references
Échantillons de voix pris en charge d'abord ; entrées audio complètes à venir
SynthID
Filigrane imperceptible de provenance IA sur chaque sortie Gemini Omni
May 19, 2026
Annoncé à Google I/O 2026
Google DeepMind
Positionnement comme successeur de Veo pour la création vidéo any-to-any
Cas d'utilisation
Storyboard multi-entrées
Déposez une image de personnage, une photo de lieu, un repère musical et une ligne d'action ; le modèle assemble le plan en un coup.
Édition vidéo conversationnelle
Modifiez un clip en langage naturel : garde-robe, arrière-plan, éclairage, timing d'un beat. Le reste du plan reste stable.
Vidéo marketing
Montages pub qui respectent la marque, la forme du produit et le texte à l'écran. Combinez photo, voix off et brief décor.
Explicatifs éducatifs
Visualisez des concepts de science, d'histoire ou d'ingénierie avec physique et raisonnement intégrés, sans perdre en clarté.
Vidéos d'avatar et de présentateur
Portrait + référence vocale : un présentateur identique sur plusieurs shorts, idéal pour formations, walkthroughs et clips sociaux.
Shorts sociaux
Clips de 10 s calés pour YouTube Shorts, Reels et TikTok. Générez des variations par chat, publiez celle qui fonctionne.
Exemples de prompts

Noir cinématographique
Détective dans une ruelle de Tokyo détrempée, lampadaires au sodium, noir teal-ambre
Edit prompt
Lancement produit
Basket avant-gardiste au-dessus d'un socle en titane, lumière clé dure, ambiance de lancement
Edit prompt
Explicatif nature
Goutte figée en couronne cristalline sur une feuille de rosée, macro à contre-jour
Edit prompt
Présentateur avatar
Présentatrice posée face à l'objectif, éclairage trois points chaleureux, bokeh 85 mm
Edit prompt
Visite architecturale
Lumière dorée dans une villa en béton brutaliste, longues ombres, poussières en suspension
Edit prompt
Beat narratif
Femme lisant une lettre près d'une fenêtre pluvieuse, l'inquiétude cédant au soulagement
Edit promptTarifs simples
Commencez gratuitement dès aujourd'hui, avec la possibilité de mettre à niveau ou d'annuler à tout moment.
Basic
500 mensuel crédits
1 utilisateur uniquement
Tous les modèles
Workflows
Standard
2800 mensuel crédits
1 utilisateur uniquement
Tous les modèles
Workflows
Pro
6000 partagé mensuel crédits
1 utilisateur
Tous les modèles
Workflows
Pro Max
24000 partagé mensuel crédits
1 utilisateur
Tous les modèles
Workflows
Enterprise
Pour des limites plus élevées
Personnalisé
conditions de tarification et de facturation

Free
For playing around
$0
forever free
Questions fréquentes
Reve 2.0
Reve AI
Le modèle d'image axé sur la mise en page de Reve AI. Placez chaque élément à la main, modifiez le résultat comme un fichier de design et rendez un texte net jusqu'en 4K.
Bernini
ByteDance
Le modèle vidéo open source de ByteDance pour l'édition par instructions, avec le reste de l'image figé et l'identité du sujet préservée.
Grok Imagine v1.5
xAI
Le modèle image-vers-vidéo de xAI avec audio synchronisé natif. Animez n'importe quelle image fixe en clip avec son, dialogues et musique.
Veo 4
Google DeepMind
Le prochain modèle vidéo de Google DeepMind. 4K natif, clips plus longs, cohérence des personnages multi-plans et langage de caméra cinéma en un seul prompt.