Question 1

Qu'est-ce que Gemini Omni ?

Accepted Answer

Gemini Omni est le premier modèle multimodal any-to-any de Google, annoncé à Google I/O 2026. La première version, Gemini Omni Flash, accepte le texte, les images, l'audio et la vidéo en entrée et produit de la vidéo en sortie, avec édition conversationnelle, cohérence des personnages et filigrane SynthID sur chaque clip.

Question 2

Gemini Omni est-il un modèle d'image ?

Accepted Answer

Non. Gemini Omni produit de la vidéo. Le modèle accepte les images en entrée aux côtés du texte, de l'audio et de la vidéo, mais la sortie générée est un clip vidéo. Google a indiqué que les modalités de sortie image et audio figurent sur la feuille de route Gemini Omni mais ne font pas partie du lancement initial.

Question 3

Comment utiliser Gemini Omni sur Morphic ?

Accepted Answer

Ouvrez Morphic, passez la barre de prompt en mode Vidéo et choisissez Gemini Omni dans le sélecteur de modèles. Joignez n'importe quelle combinaison de texte, image, audio et vidéo, puis lancez le prompt. Pour modifier le résultat, demandez-le dans le message suivant ; la scène conserve le contexte précédent.

Question 4

Quelle est la durée des vidéos Gemini Omni ?

Accepted Answer

Les clips Gemini Omni Flash sont limités à 10 secondes au lancement. Google a présenté ce plafond comme une décision de déploiement visant à élargir l'accès durant la phase initiale, et non comme une limite stricte du modèle ; des durées Gemini Omni plus longues sont donc possibles dans les futures versions.

Question 5

Quelles entrées Gemini Omni accepte-t-il ?

Accepted Answer

Gemini Omni accepte le texte, les images, l'audio et la vidéo dans n'importe quelle combinaison au sein d'un seul prompt. Les références de voix constituent la première entrée audio prise en charge ; des entrées audio plus larges et de nouvelles modalités de sortie sont prévues.

Question 6

Comment Gemini Omni se compare-t-il à Veo 3.1 ?

Accepted Answer

Veo 3.1 est le modèle vidéo photoréaliste de Google DeepMind avec une résolution 4K, de l'audio natif et des clips de 8 secondes, calibré pour un réalisme de qualité broadcast. Gemini Omni Flash est son cousin any-to-any, durée plus courte (jusqu'à 10 secondes), centré sur le raisonnement multi-entrées, l'édition conversationnelle et la cohérence persistante des personnages au fil des modifications. Veo est le spécialiste du réalisme ; Gemini Omni est le directeur multimodal.

Question 7

Comment Gemini Omni se compare-t-il à Seedance 2.0 ?

Accepted Answer

Gemini Omni et Seedance 2.0 sont tous deux des modèles vidéo multimodaux. Seedance 2.0 accepte jusqu'à 12 assets mixtes par génération avec synthèse audio native et synchronisation au beat musical, en 1080p, de 4 à 15 secondes. Gemini Omni Flash se concentre sur l'édition conversationnelle tour par tour et sur la physique et le raisonnement réel de Google, actuellement limité à 10 secondes.

Question 8

Gemini Omni inclut-il un filigrane ?

Accepted Answer

Oui. Chaque vidéo générée par Gemini Omni porte le filigrane imperceptible SynthID de Google pour la provenance IA. Le filigrane est invisible pour les spectateurs et survit aux modifications courantes comme le réencodage et le redimensionnement.

Question 9

Gemini Omni prend-il en charge la cohérence des personnages ?

Accepted Answer

Oui. Les personnages introduits dans un plan Gemini Omni conservent leur visage, leurs vêtements et leur voix d'un plan à l'autre et au fil des modifications successives dans la même conversation, sans avoir à recharger la référence à chaque tour.

Question 10

Quand Gemini Omni a-t-il été lancé ?

Accepted Answer

Google a annoncé Gemini Omni à Google I/O 2026 le 19 mai 2026. Gemini Omni Flash est la première version de la famille, les sorties image et audio étant présentées comme des ajouts prévus pour l'avenir.

Gemini Omni

Fonctionnalités clés

Entrée any-to-any

Édition conversationnelle

Personnages stables

Physique et raisonnement réel

Références de voix pour l'audio

Filigrane SynthID

Spécifications techniques

Cas d'utilisation

Storyboard multi-entrées

Édition vidéo conversationnelle

Vidéo marketing

Explicatifs éducatifs

Vidéos d'avatar et de présentateur

Shorts sociaux

Exemples de prompts

Noir cinématographique

Lancement produit

Explicatif nature

Présentateur avatar

Visite architecturale

Beat narratif

Tarifs simples

Questions fréquentes

En savoir plus sur Gemini Omni

Autres modèles