Modèles IA
sur Morphic

Explorez tous les modèles IA disponibles sur Morphic, de la génération d'images et de vidéos à la production audio et à l'agrandissement.

VidéoBientôt disponible

Kling 4.0

Kling

Le prochain modèle vidéo Kling de Kuaishou, attendu dans les prochaines semaines. Des clips plus longs et plus de fidélité qu'avant, dans la prochaine version majeure de Kling.

Seedream 5.0 Pro

ByteDance

Seedream 5.0 Pro est le modèle d'image de ByteDance pour l'édition précise par emplacement, la séparation multicouche, les infographies denses et le texte natif en 14 langues.

Nano Banana 2 Lite

Google DeepMind

Le modèle Gemini 3.1 Flash-Lite Image de Google DeepMind sur Morphic. Nano Banana 2 Lite génère des images 1K en environ quatre secondes, avec cohérence des personnages, texte lisible dans l'image, connaissance du monde pour les mises en page, l'édition et la composition multi-images.

Seed Audio 1.0

ByteDance

Le modèle audio tout-en-un de ByteDance : génère voix, musique instrumentale et effets sonores ensemble en une seule passe, avec clonage vocal zero-shot et dialogues multi-locuteurs.

Seedance 2.0 4K

ByteDance

Le Seedance 2.0 de ByteDance génère désormais en 4K natif sur Morphic. Détail net et texture propre maintenus dans le mouvement, plus entrée multimodale, audio natif et mouvements de caméra contrôlables.

Seedance 2.5

ByteDance

Seedance 2.5 est le modèle vidéo nouvelle génération de ByteDance : jusqu'à 30 secondes de vidéo native en plan unique, jusqu'à 50 références multimodales, montage interne renforcé et sortie de 720p à 4K.

Happy Horse 1.1

Alibaba

Le modèle audio-vidéo conjoint d'Alibaba sur Morphic. Happy Horse 1.1 génère la vidéo et l'audio synchronisé en une seule passe, avec une synchronisation labiale multilingue native, du reference-to-video pour jusqu'à 9 sujets et neuf formats d'image.

Kling 3.0 Turbo

Kling

Le modèle vidéo Kling de Kuaishou optimisé pour la vitesse, sur Morphic. Kling 3.0 Turbo conserve une forte fidélité au prompt et la cohérence multi-plans, tout en générant rapidement en 720p et 1080p.

Seedance 2.0 Mini

ByteDance

Le palier léger de Seedance 2.0 signé ByteDance. Références multimodales image, vidéo et audio, jusqu'à 1080p, à environ moitié prix de Seedance 2.0.

Ideogram 4.0

Ideogram

Le modèle d'image à poids ouverts d'Ideogram. Texte dans l'image de pointe, contrôle par bounding box, prompts JSON structurés et sortie 2K sous licence commerciale.

Reve 2.0

Reve AI

Le modèle d'image axé sur la mise en page de Reve AI, aussi appelé Reve Image 2. Placez les éléments à la main, modifiez un résultat comme un fichier de design et rendez un texte net jusqu'en 4K.

Texte-vers-imageContrôle par mise en pageÉdition d'imageComposition multi-références+2 de plus

Bernini

ByteDance

Le modèle unifié et open source de ByteDance pour l'édition et la génération de vidéo IA. Ajoutez, supprimez ou restylisez des éléments d'un clip en gardant les régions intactes figées, avec un mode sujet-vers-vidéo qui préserve l'identité.

Édition vidéoSujet-vers-vidéoÉdition guidée par référenceTexte-vers-vidéo+1 de plus

Grok Imagine v1.5

xAI

Le modèle image-vers-vidéo de xAI sur Morphic. Transformez une image fixe en clip avec audio synchronisé natif, dialogues synchronisés sur les lèvres, effets sonores et musique, plus un suivi de prompt précis et l'extension de vidéo.

Image vers vidéoTexte vers vidéoAudio synchronisé natifDialogues synchronisés sur les lèvres+4 de plus

Veo 4

Google DeepMind

Le modèle vidéo de nouvelle génération de Google DeepMind. Veo 4 dépasse la fenêtre de 8 secondes de Veo 3.1 avec des clips 4K natifs plus longs, des personnages verrouillés sur plusieurs plans, le séquençage storyboard, un langage de caméra cinéma et un audio natif multi-locuteurs.

Texte vers vidéoImage vers vidéoFrames vers vidéoRéférences vers vidéo+5 de plus

MAI-Image-2.5

Microsoft

Le modèle text-to-image de Microsoft sur Morphic. MAI-Image-2.5 entre directement à la 3e place du classement Arena text-to-image, avec un rendu de texte plus net, de l'illustration stylisée et des visuels commerciaux pensés pour le design et la marque.

Text-to-imageRendu de texte dans l'imageIllustration styliséeVisuels commerciaux+4 de plus

Gemini Omni

Google DeepMind

Le modèle multimodal any-to-any de Google sur Morphic. Gemini Omni Flash transforme texte, images, audio et vidéo en une seule vidéo, avec personnages unifiés, physique réaliste, édition conversationnelle et filigrane SynthID.

Recraft V4.1 Pro

Recraft

Le tier raster premium de Recraft, repensé autour d'un photoréalisme plus calme, de dégradés plus doux et d'un modèle qui lit les prompts courts comme un directeur créatif. Sortie 2K native, composition design.

Texte vers imageImage vers image

Krea 2

Krea AI

Le premier modèle d'image de Krea AI sur Morphic, conçu de zéro pour l'esthétique et le contrôle créatif. Transfert de style depuis des références, moodboards, contrôle de la créativité, et une plage qui va du grain argentique au studio photoréaliste net.

Happy Horse 1.0

Alibaba

Le modèle vidéo d'Alibaba qui génère vidéo et audio conjointement en une seule passe. Synchronisation labiale native en 7 langues, sortie 1080p, contrôle par références et n°1 à l'Elo de l'Artificial Analysis Video Arena au lancement.

Texte vers vidéoImage vers vidéoRéférence vers vidéoÉdition vidéo+3 de plus

ChatGPT Images 2.0

OpenAI

Le modèle d'image d'OpenAI avec raisonnement natif, sortie jusqu'à 2K, lots multi-images avec continuité des personnages et rendu de texte multilingue solide pour diagrammes, affiches et travail de design.

Texte vers imageImage vers imageMode réflexionLots multi-images+2 de plus

Gemini 3.1 Flash TTS

Google DeepMind

Le modèle de synthèse vocale le plus expressif de Google sur Morphic. Gemini 3.1 Flash TTS transforme le texte en narration naturelle et dirigeable, avec balises audio intégrées, dialogue multi-locuteurs et filigrane SynthID dans de nombreuses langues.

Sync V3

Sync

Le modèle de lip-sync phare de Sync. Sync V3 (sync-3) génère un lip-sync 4K sans scintillement, avec compréhension à l'échelle du plan, gestion des obstructions et prise en charge des angles extrêmes.

Lip-syncGénération vidéo pilotée par l'audio

Wan 2.7

Alibaba

Le modèle vidéo phare Wan d'Alibaba avec le raisonnement de prompt Thinking Mode, une sortie 1080p cinématographique et une cohérence des personnages pilotée par référence d'un plan à l'autre.

Texte vers vidéoImage vers vidéoRéférence vers vidéoÉdition vidéo

LTX 2.3

Lightricks

Le modèle vidéo audio-visuel open source de Lightricks. LTX 2.3 génère vidéo et audio synchronisés en une seule passe, avec une sortie verticale native jusqu'à 4K.

Texte vers vidéoImage vers vidéoAudio vers vidéoGénération audio native

Nano Banana 2

Google DeepMind

Le Gemini 3.1 Flash Image de Google DeepMind. Génération d'images de niveau pro à la vitesse Flash : cohérence des sujets sur jusqu'à 5 personnages et 14 objets, ancrage web en temps réel, rendu de texte précis et résolutions jusqu'à 4K.

Texte vers imageImage vers imageÉdition multi-toursCohérence des sujets+3 de plus

Kling 3.0

Kling

Le modèle vidéo phare prompt-first de Kuaishou. Kling 3.0 (V3) offre un mouvement photoréaliste, un mode Réalisateur multi-plans et un audio multilingue natif en 1080p et 4K natifs à 30 fps.

Texte-vers-vidéoImage-vers-vidéoMode Réalisateur multi-plansAudio natif

Recraft V4 Pro

Recraft

Le modèle d'images raster haute résolution de Recraft, reconstruit autour du sens du design, d'une anatomie affinée, d'une composition équilibrée et du détail éditorial en sortie native 2K.

Texte vers imageImage vers image

Seedream 5.0 Lite

ByteDance

Le modèle d'image axé sur le raisonnement de ByteDance. Seedream 5.0 Lite combine une génération réfléchie et une recherche en ligne intégrée, pour que les prompts liés à l'actualité s'affichent avec un contexte en direct.

Texte vers imageGénération basée sur le raisonnementContexte de recherche en ligne

Qwen Edit Angles

Alibaba Qwen

Le modèle multi-angles Qwen-Image-Edit d'Alibaba. Générez le même sujet sous différentes perspectives de caméra avec une géométrie, un éclairage et une identité constants, à partir d'une seule image d'entrée.

Image vers imageSynthèse de vues nouvellesÉdition tenant compte de la caméra

Seedance 1.5 Pro

ByteDance

Le modèle vidéo audio-visuel natif de ByteDance. Seedance 1.5 Pro génère vidéo et audio synchronisés en une seule passe, avec synchronisation labiale multilingue et contrôle de caméra cinématographique.

Texte vers vidéoImage vers vidéoGénération audio nativeSynchro labiale multilingue

Seedream 4.5

ByteDance

Le modèle d'image amélioré de ByteDance, avec un meilleur respect du prompt, une gestion des références multi-images et un rendu de texte dense, unifiant texte-vers-image et édition d'image dans un seul modèle.

Texte-vers-imageImage-vers-imageRéférence multi-images

Seedance 2.0

ByteDance

Le modèle vidéo IA multimodal de nouvelle génération de ByteDance, prend en charge images, vidéos, audio et texte simultanément. Offre un mouvement hyper-réaliste, des mouvements de caméra contrôlables, une synthèse audio native, une synchronisation au rythme musical et une extension vidéo transparente avec jusqu'à 12 assets par génération.

Texte-vers-VidéoImage-vers-VidéoVidéo-vers-VidéoAudio-vers-Vidéo+7 de plus

Flux 2 Pro

Black Forest Labs

Le modèle premium de génération d'images IA de Black Forest Labs offrant la plus haute qualité avec des détails supérieurs, une précision des couleurs et une fidélité aux prompts pour les applications professionnelles.

Texte vers image

Gemini Image Pro

Google

Le modèle premium de génération d'images multimodal de Google avec la plus haute qualité, un rendu de texte avancé et une connaissance approfondie du monde pour de l'imagerie IA de qualité professionnelle.

Texte vers imageÉdition d'imageRendu de texteCompréhension multimodale

Nano Banana Pro

Google DeepMind

Gemini 3 Pro Image de Google DeepMind. Génération et édition d'images de qualité studio avec cohérence des sujets, rendu de texte professionnel, précision ancrée sur le web et résolutions jusqu'à 4K sur 14 formats.

Texte vers imageImage vers imageÉdition multi-toursCohérence des sujets+3 de plus

Hailuo 2.3

MiniMax

Le dernier modèle vidéo IA de MiniMax avec une qualité visuelle améliorée, une cohérence de mouvement accrue et une compréhension des prompts supérieure, la prochaine évolution de la vidéo IA cinématographique.

Texte vers vidéoImage vers vidéo

Wan 2.6

Alibaba

Le modèle de génération vidéo IA open source d'Alibaba offrant du texte-vers-vidéo et image-vers-vidéo de haute qualité avec une forte adhérence au prompt et des capacités de style diversifiées.

Texte-vers-VidéoImage-vers-Vidéo

Veed Fabric 1.0

Veed

Le modèle de vidéo parlante de Veed. Fabric 1.0 prend une image fixe et un fichier audio, puis génère une vidéo parlante avec lèvres, tête, corps et mains synchronisés.

Image vers vidéo parlanteAnimation pilotée par l'audioSynchronisation labiale

Vidu Q3

Shengshu Technology

Le dernier modèle vidéo IA de Shengshu Technology avec une qualité visuelle améliorée, une meilleure cohérence de mouvement et des capacités de génération supérieures par rapport à Vidu Q2.

Texte-vers-VidéoImage-vers-VidéoRéférences-vers-Vidéo

Veo 3.1

Google DeepMind

Le modèle de génération vidéo de pointe de Google DeepMind offrant une sortie photoréaliste avec une précision physique de pointe, une synthèse audio native et une résolution 4K.

Texte-vers-VidéoImage-vers-VidéoImages-vers-VidéoRéférences-vers-Vidéo+1 de plus

Sora

OpenAI

Le modèle révolutionnaire de génération vidéo IA d'OpenAI capable de créer des vidéos imaginatives et de haute qualité à partir de prompts textuels avec une forte compréhension de l'espace 3D, de la physique et de la narration créative.

Texte-vers-VidéoImage-vers-Vidéo

Kling O3

Kling

Le modèle vidéo IA phare de Kling avec l'ensemble de fonctionnalités le plus large, texte-vers-vidéo, image-vers-vidéo, vidéo-vers-vidéo, images-vers-vidéo, contrôle de mouvement et génération par référence.

Texte-vers-VidéoImage-vers-VidéoVidéo-vers-VidéoImages-vers-Vidéo+2 de plus

Kling

Kling

Le modèle vidéo IA standard de Kling (v2.6 Pro) pour la génération texte-vers-vidéo et image-vers-vidéo avec de fortes capacités de stylisation et une qualité fiable.

Texte-vers-VidéoImage-vers-Vidéo

Topaz Image

Topaz Labs

Upscaling d'images IA de qualité professionnelle par Topaz Labs, amélioration de résolution jusqu'à 4x avec récupération intelligente des détails, réduction du bruit et suppression des artefacts.

Upscale d'ImageRécupération de DétailsRéduction du Bruit

Topaz Video

Topaz Labs

Upscaling vidéo IA de qualité professionnelle par Topaz Labs, upscale de résolution vidéo jusqu'à 4x avec interpolation d'images, stabilisation et amélioration des détails.

Upscale VidéoInterpolation d'ImagesStabilisationAmélioration des Détails

Gemini Image

Google

Le modèle IA multimodal de Google avec des capacités natives de génération d'images, combinant une compréhension avancée du langage avec une sortie visuelle de haute qualité pour une création intégrée texte-et-image.

Texte vers imageÉdition d'imageRendu de texteCompréhension multimodale

Crystal Image

Morphic

Mise à l'échelle rapide et efficace d'images par IA, amélioration de résolution jusqu'à 4x avec un excellent rapport qualité-vitesse pour les flux de travail d'amélioration d'images au quotidien.

Mise à l'échelle d'imagesAmélioration des détailsTraitement rapide

Crystal Video

Morphic

Mise à l'échelle vidéo IA rapide et efficace, améliorez la résolution vidéo jusqu'à 4x avec interpolation d'images et une excellente vitesse de traitement pour l'amélioration vidéo au quotidien.

Mise à l'échelle vidéoInterpolation d'imagesTraitement rapide

Z-Image Turbo

fal.ai

Génération d'images IA ultra-rapide optimisée pour la vitesse, temps de génération inférieur à la seconde pour le prototypage rapide, les flux de travail à haut volume et l'exploration visuelle instantanée.

Texte-vers-Image

Grok Imagine

xAI

Le puissant modèle IA cross-modal de xAI générant images et vidéos à partir de texte, avec édition d'images, transformation vidéo et cinq modes de génération distincts.

Texte vers imageImage vers imageTexte vers vidéoImage vers vidéo+1 de plus

Runway Gen-4 Aleph

Runway

Le modèle IA texte-vers-vidéo phare de Runway offrant une sortie de qualité cinématique avec une cohérence exceptionnelle des personnages, des performances émotionnelles et des capacités de narration professionnelles.

Texte-vers-Vidéo

Seedance

ByteDance

Le modèle vidéo IA de ByteDance excellent dans l'animation expressive de personnages, la chorégraphie de danse et le mouvement humain avec support audio natif et génération multi-entrées.

Texte-vers-VidéoImage-vers-VidéoImages-vers-VidéoAudio Natif

Hailuo-02

MiniMax

Le modèle standard de génération vidéo IA de MiniMax, reconnu pour son esthétique cinématographique, la qualité naturelle de ses mouvements et sa forte compréhension des prompts pour le texte vers vidéo et l'image vers vidéo.

Texte vers vidéoImage vers vidéo

Seedream

ByteDance

Le modèle de génération d'images IA haute qualité de ByteDance offrant une sortie vibrante et détaillée avec de fortes capacités texte-vers-image et image-vers-image jusqu'à une résolution 2K.

Texte-vers-ImageImage-vers-Image

Kontext

Black Forest Labs

Le modèle d'édition d'images IA de Black Forest Labs qui modifie les images existantes en langage naturel, changez des éléments, remplacez des arrière-plans et éditez des compositions tout en préservant le style original.

Image-vers-ImageÉdition d'ImagesRemplacement d'Arrière-planTransfert de Style

Runway Gen-4 Image

Runway

Le dernier modèle IA de Runway pour générer de la vidéo de qualité cinématique à partir d'images statiques, cohérence exceptionnelle des personnages, mouvement réaliste et narration professionnelle.

Image-vers-Vidéo

GPT Image 1.5

OpenAI

Le modèle avancé de génération d'images IA d'OpenAI avec un rendu de texte de premier ordre, un suivi d'instructions exceptionnel et des capacités sophistiquées d'édition d'images.

Texte vers imageImage vers imageRendu de texteÉdition d'image

Vidu Q2

Shengshu Technology

Le modèle de génération vidéo IA de Shengshu Technology offrant du texte-vers-vidéo et image-vers-vidéo haute fidélité avec une forte cohérence visuelle et une génération par référence.

Texte-vers-VidéoImage-vers-VidéoRéférences-vers-Vidéo

Kling Motion Control

Kling

Le modèle spécialisé de contrôle de mouvement de caméra de Kling pour la vidéo IA, spécifiez des mouvements de caméra précis, des trajectoires et des plans cinématiques dans vos vidéos générées.

Texte vers vidéoSpécification du mouvement de caméraContrôle de trajectoire

Kling O1

Kling

Le modèle IA vidéo-vers-vidéo spécialisé de Kling pour l'édition, la transformation et le restyling de séquences existantes avec des effets visuels et un transfert de style alimentés par l'IA.

Vidéo-vers-VidéoImages-vers-VidéoTransfert de Style

Flux

Black Forest Labs

Le modèle de génération d'images IA rapide de Black Forest Labs offrant des images polyvalentes et de haute qualité dans des styles photoréalistes, artistiques et graphiques avec des temps de génération rapides.

Texte vers image

Luma Dream Machine

Luma AI

Le modèle de génération vidéo IA rapide et performant de Luma AI, reconnu pour sa vitesse, sa qualité visuelle et son rendu de scène unifié à travers divers styles et sujets.

Texte-vers-VidéoImage-vers-Vidéo

ElevenLabs

ElevenLabs

Plateforme audio IA de référence, synthèse vocale, texte vers musique, texte vers effets sonores et dialogue IA avec une synthèse vocale de qualité humaine et une production audio complète.

Synthèse vocaleTexte vers musiqueTexte vers effets sonoresTexte vers dialogue

Guides de modèles

Tutoriels, comparaisons et explications pour des modèles spécifiques.

ByteDance Bernini : guide complet de l'édition vidéo par IA et des prompts

Le guide complet de ByteDance Bernini, le modèle vidéo IA open source : fonctionnalités, caractéristiques, le verrou de cohérence et la structure de prompt par tâche.

Cas d'usage de ChatGPT Images 2.0 pour l'e-commerce, le marketing et le branding

Un guide pratique des cas d'usage de ChatGPT Images 2.0. Apprenez à créer des visuels produits, du contenu marketing multilingue, des éléments de marque et plus encore avec GPT Image 2.

Gemini Omni Flash : guide complet, prompts et fonctionnalités

Le guide complet de Gemini Omni Flash sur Morphic : fonctionnalités, audio natif, édition conversationnelle, cohérence des personnages et prompting avec exemples.

Grok Imagine Video 1.5 : guide, prompts et fonctionnalités

Le guide complet de Grok Imagine Video 1.5 sur Morphic : audio natif synchronisé, prompting, cas d'usage et spécifications techniques.

Happy Horse 1.0 : guide complet des prompts, fonctionnalités et astuces

Apprenez à rédiger vos prompts pour Happy Horse 1.0 et obtenir les meilleurs résultats vidéo IA. Fonctionnalités, astuces de prompt, indications caméra, audio et bonnes pratiques sur Morphic.

Happy Horse 1.1 : guide complet, prompts et fonctionnalités

Le guide complet de Happy Horse 1.1 sur Morphic : fonctionnalités, specs, audio natif, reference-to-video et prompting avec des exemples.

Comment utiliser le générateur de vidéo IA Happy Horse 1.0

Guide pas à pas pour utiliser le générateur de vidéo IA Happy Horse 1.0 sur Morphic. Créez des vidéos IA à partir de texte ou d'images en quelques minutes.

Kling 3.0 Turbo : guide complet, prompts et fonctionnalités

Le guide complet de Kling 3.0 Turbo sur Morphic : fonctionnalités, spécifications, prompting multi-plans avec des exemples, et quand le préférer à Kling 3.0.

Nano Banana 2 Lite : guide complet, prompts et cas d'usage

Le guide complet de Nano Banana 2 Lite : la checklist de prompt FRAME, des cas d'usage, des exemples, et des conseils pour la constance des personnages et le texte dans l'image.

Seed Audio 1.0 : le guide complet

Comment utiliser Seed Audio 1.0 : voix, musique et SFX en une passe, clonage de voix zero-shot, scènes multi-locuteurs et édition audio.

Seedance 2.0 4K : guide complet, prompts et fonctionnalités

Le guide complet de Seedance 2.0 4K sur Morphic : 4K native, specs, cas d'usage et prompting avec des exemples.

Seedance 2.5 : guide complet, fonctions, prompts et vidéo plus longue

Le guide complet Seedance 2.5 : vidéo en plan unique plus longue, continuité par références, contrôle caméra et finition 4K, avec des exemples de prompts.

Seedance 2.0 Mini : guide complet, fonctionnalités, prompts et vidéo rapide

Le guide complet de Seedance 2.0 Mini : le palier rapide et économique pour la vidéo à haut volume, avec un workflow de génération et comparaison par lots et des conseils de prompt.

Seedream 5.0 Pro : guide complet, fonctionnalités, prompts et édition

Le guide complet de Seedream 5.0 Pro : édition par emplacement, séparation multicouche, infographies denses et texte natif en 14 langues.