Modèles IA
sur Morphic

Explorez tous les modèles IA disponibles sur Morphic, de la génération d'images et de vidéos à la production audio et à l'agrandissement.

icons
Image

Reve 2.0

Reve AI

Le modèle d'image axé sur la mise en page de Reve AI, aussi appelé Reve Image 2. Placez les éléments à la main, modifiez un résultat comme un fichier de design et rendez un texte net jusqu'en 4K.

Texte-vers-imageContrôle par mise en pageÉdition d'imageComposition multi-références+2 de plus
Vidéo

Bernini

ByteDance

Le modèle unifié et open source de ByteDance pour l'édition et la génération de vidéo IA. Ajoutez, supprimez ou restylisez des éléments d'un clip en gardant les régions intactes figées, avec un mode sujet-vers-vidéo qui préserve l'identité.

Édition vidéoSujet-vers-vidéoÉdition guidée par référenceTexte-vers-vidéo+1 de plus
Vidéo

Grok Imagine v1.5

xAI

Le modèle image-vers-vidéo de xAI sur Morphic. Transformez une image fixe en clip avec audio synchronisé natif, dialogues synchronisés sur les lèvres, effets sonores et musique, plus un suivi de prompt précis et l'extension de vidéo.

Image vers vidéoTexte vers vidéoAudio synchronisé natifDialogues synchronisés sur les lèvres+4 de plus
Vidéo

Veo 4

Google DeepMind

Le modèle vidéo de nouvelle génération de Google DeepMind. Veo 4 dépasse la fenêtre de 8 secondes de Veo 3.1 avec des clips 4K natifs plus longs, des personnages verrouillés sur plusieurs plans, le séquençage storyboard, un langage de caméra cinéma et un audio natif multi-locuteurs.

Texte vers vidéoImage vers vidéoFrames vers vidéoRéférences vers vidéo+5 de plus
Image

MAI-Image-2.5

Microsoft

Le modèle text-to-image de Microsoft sur Morphic. MAI-Image-2.5 entre directement à la 3e place du classement Arena text-to-image, avec un rendu de texte plus net, de l'illustration stylisée et des visuels commerciaux pensés pour le design et la marque.

Text-to-imageRendu de texte dans l'imageIllustration styliséeVisuels commerciaux+4 de plus
Multimodal

Gemini Omni

Google DeepMind

Le modèle multimodal any-to-any de Google sur Morphic. Gemini Omni Flash transforme texte, images, audio et vidéo en une seule vidéo, avec personnages unifiés, physique réaliste, édition conversationnelle et filigrane SynthID.

Entrée any-to-anyTexte vers vidéoImage vers vidéoAudio vers vidéo+6 de plus
Image

Recraft V4.1 Pro

Recraft

Le tier raster premium de Recraft, repensé autour d'un photoréalisme plus calme, de dégradés plus doux et d'un modèle qui lit les prompts courts comme un directeur créatif. Sortie 2K native, composition design.

Texte vers imageImage vers image
Vidéo

Happy Horse 1.0

Alibaba

Le modèle vidéo d'Alibaba qui génère vidéo et audio conjointement en une seule passe. Synchronisation labiale native en 7 langues, sortie 1080p, contrôle par références et n°1 à l'Elo de l'Artificial Analysis Video Arena au lancement.

Texte vers vidéoImage vers vidéoRéférence vers vidéoÉdition vidéo+3 de plus
Image

ChatGPT Images 2.0

OpenAI

Le modèle d'image d'OpenAI avec raisonnement natif, sortie jusqu'à 2K, lots multi-images avec continuité des personnages et rendu de texte multilingue solide pour diagrammes, affiches et travail de design.

Texte vers imageImage vers imageMode réflexionLots multi-images+2 de plus
Vidéo

Sync V3

Sync

Le modèle de lip-sync phare de Sync. Sync V3 (sync-3) génère un lip-sync 4K sans scintillement, avec compréhension à l'échelle du plan, gestion des obstructions et prise en charge des angles extrêmes.

Lip-syncGénération vidéo pilotée par l'audio
Vidéo

Wan 2.7

Alibaba

Le modèle vidéo phare Wan d'Alibaba avec le raisonnement de prompt Thinking Mode, une sortie 1080p cinématographique et une cohérence des personnages pilotée par référence d'un plan à l'autre.

Texte vers vidéoImage vers vidéoRéférence vers vidéoÉdition vidéo
Vidéo

LTX 2.3

Lightricks

Le modèle vidéo audio-visuel open source de Lightricks. LTX 2.3 génère vidéo et audio synchronisés en une seule passe, avec une sortie verticale native jusqu'à 4K.

Texte vers vidéoImage vers vidéoAudio vers vidéoGénération audio native
Image

Nano Banana 2

Google DeepMind

Le Gemini 3.1 Flash Image de Google DeepMind. Génération d'images de niveau pro à la vitesse Flash : cohérence des sujets sur jusqu'à 5 personnages et 14 objets, ancrage web en temps réel, rendu de texte précis et résolutions jusqu'à 4K.

Texte vers imageImage vers imageÉdition multi-toursCohérence des sujets+3 de plus
Vidéo

Kling 3.0

Kling

Le modèle vidéo phare prompt-first de Kuaishou. Kling 3.0 (V3) offre un mouvement photoréaliste, un mode Réalisateur multi-plans et un audio multilingue natif en 1080p et 4K natifs à 30 fps.

Texte-vers-vidéoImage-vers-vidéoMode Réalisateur multi-plansAudio natif
Image

Recraft V4 Pro

Recraft

Le modèle d'images raster haute résolution de Recraft, reconstruit autour du sens du design, d'une anatomie affinée, d'une composition équilibrée et du détail éditorial en sortie native 2K.

Texte vers imageImage vers image
Image

Seedream 5.0 Lite

ByteDance

Le modèle d'image axé sur le raisonnement de ByteDance. Seedream 5.0 Lite combine une génération réfléchie et une recherche en ligne intégrée, pour que les prompts liés à l'actualité s'affichent avec un contexte en direct.

Texte vers imageGénération basée sur le raisonnementContexte de recherche en ligne
Image

Qwen Edit Angles

Alibaba Qwen

Le modèle multi-angles Qwen-Image-Edit d'Alibaba. Générez le même sujet sous différentes perspectives de caméra avec une géométrie, un éclairage et une identité constants, à partir d'une seule image d'entrée.

Image vers imageSynthèse de vues nouvellesÉdition tenant compte de la caméra
Vidéo

Seedance 1.5 Pro

ByteDance

Le modèle vidéo audio-visuel natif de ByteDance. Seedance 1.5 Pro génère vidéo et audio synchronisés en une seule passe, avec synchronisation labiale multilingue et contrôle de caméra cinématographique.

Texte vers vidéoImage vers vidéoGénération audio nativeSynchro labiale multilingue
Image

Seedream 4.5

ByteDance

Le modèle d'image amélioré de ByteDance, avec un meilleur respect du prompt, une gestion des références multi-images et un rendu de texte dense, unifiant texte-vers-image et édition d'image dans un seul modèle.

Texte-vers-imageImage-vers-imageRéférence multi-images
Image

Nano Banana Pro

Google DeepMind

Gemini 3 Pro Image de Google DeepMind. Génération et édition d'images de qualité studio avec cohérence des sujets, rendu de texte professionnel, précision ancrée sur le web et résolutions jusqu'à 4K sur 14 formats.

Texte vers imageImage vers imageÉdition multi-toursCohérence des sujets+3 de plus
Vidéo

Veed Fabric 1.0

Veed

Le modèle de vidéo parlante de Veed. Fabric 1.0 prend une image fixe et un fichier audio, puis génère une vidéo parlante avec lèvres, tête, corps et mains synchronisés.

Image vers vidéo parlanteAnimation pilotée par l'audioSynchronisation labiale
Utilitaire

Crystal Image

Morphic

Mise à l'échelle rapide et efficace d'images par IA, amélioration de résolution jusqu'à 4x avec un excellent rapport qualité-vitesse pour les flux de travail d'amélioration d'images au quotidien.

Mise à l'échelle d'imagesAmélioration des détailsTraitement rapide
Utilitaire

Crystal Video

Morphic

Mise à l'échelle vidéo IA rapide et efficace, améliorez la résolution vidéo jusqu'à 4x avec interpolation d'images et une excellente vitesse de traitement pour l'amélioration vidéo au quotidien.

Mise à l'échelle vidéoInterpolation d'imagesTraitement rapide
Audio

ElevenLabs

ElevenLabs

Plateforme audio IA de référence, synthèse vocale, texte vers musique, texte vers effets sonores et dialogue IA avec une synthèse vocale de qualité humaine et une production audio complète.

Synthèse vocaleTexte vers musiqueTexte vers effets sonoresTexte vers dialogue
Image

Flux

Black Forest Labs

Le modèle de génération d'images IA rapide de Black Forest Labs offrant des images polyvalentes et de haute qualité dans des styles photoréalistes, artistiques et graphiques avec des temps de génération rapides.

Texte vers image
Image

Flux 2 Pro

Black Forest Labs

Le modèle premium de génération d'images IA de Black Forest Labs offrant la plus haute qualité avec des détails supérieurs, une précision des couleurs et une fidélité aux prompts pour les applications professionnelles.

Texte vers image
Image

Gemini Image

Google

Le modèle IA multimodal de Google avec des capacités natives de génération d'images, combinant une compréhension avancée du langage avec une sortie visuelle de haute qualité pour une création intégrée texte-et-image.

Texte vers imageÉdition d'imageRendu de texteCompréhension multimodale
Image

Gemini Image Pro

Google

Le modèle premium de génération d'images multimodal de Google avec la plus haute qualité, un rendu de texte avancé et une connaissance approfondie du monde pour de l'imagerie IA de qualité professionnelle.

Texte vers imageÉdition d'imageRendu de texteCompréhension multimodale
Image

GPT Image 1.5

OpenAI

Le modèle avancé de génération d'images IA d'OpenAI avec un rendu de texte de premier ordre, un suivi d'instructions exceptionnel et des capacités sophistiquées d'édition d'images.

Texte vers imageImage vers imageRendu de texteÉdition d'image
Multimodal

Grok Imagine

xAI

Le puissant modèle IA cross-modal de xAI générant images et vidéos à partir de texte, avec édition d'images, transformation vidéo et cinq modes de génération distincts.

Texte vers imageImage vers imageTexte vers vidéoImage vers vidéo+1 de plus
Vidéo

Hailuo 2.3

MiniMax

Le dernier modèle vidéo IA de MiniMax avec une qualité visuelle améliorée, une cohérence de mouvement accrue et une compréhension des prompts supérieure, la prochaine évolution de la vidéo IA cinématographique.

Texte vers vidéoImage vers vidéo
Vidéo

Hailuo-02

MiniMax

Le modèle standard de génération vidéo IA de MiniMax, reconnu pour son esthétique cinématographique, la qualité naturelle de ses mouvements et sa forte compréhension des prompts pour le texte vers vidéo et l'image vers vidéo.

Texte vers vidéoImage vers vidéo
Vidéo

Kling

Kling

Le modèle vidéo IA standard de Kling (v2.6 Pro) pour la génération texte-vers-vidéo et image-vers-vidéo avec de fortes capacités de stylisation et une qualité fiable.

Texte-vers-VidéoImage-vers-Vidéo
Vidéo

Kling Motion Control

Kling

Le modèle spécialisé de contrôle de mouvement de caméra de Kling pour la vidéo IA, spécifiez des mouvements de caméra précis, des trajectoires et des plans cinématiques dans vos vidéos générées.

Texte vers vidéoSpécification du mouvement de caméraContrôle de trajectoire
Vidéo

Kling O1

Kling

Le modèle IA vidéo-vers-vidéo spécialisé de Kling pour l'édition, la transformation et le restyling de séquences existantes avec des effets visuels et un transfert de style alimentés par l'IA.

Vidéo-vers-VidéoImages-vers-VidéoTransfert de Style
Vidéo

Kling O3

Kling

Le modèle vidéo IA phare de Kling avec l'ensemble de fonctionnalités le plus large, texte-vers-vidéo, image-vers-vidéo, vidéo-vers-vidéo, images-vers-vidéo, contrôle de mouvement et génération par référence.

Texte-vers-VidéoImage-vers-VidéoVidéo-vers-VidéoImages-vers-Vidéo+2 de plus
Image

Kontext

Black Forest Labs

Le modèle d'édition d'images IA de Black Forest Labs qui modifie les images existantes en langage naturel, changez des éléments, remplacez des arrière-plans et éditez des compositions tout en préservant le style original.

Image-vers-ImageÉdition d'ImagesRemplacement d'Arrière-planTransfert de Style
Vidéo

Luma Dream Machine

Luma AI

Le modèle de génération vidéo IA rapide et performant de Luma AI, reconnu pour sa vitesse, sa qualité visuelle et son rendu de scène unifié à travers divers styles et sujets.

Texte-vers-VidéoImage-vers-Vidéo
Vidéo

Runway Gen-4 Aleph

Runway

Le modèle IA texte-vers-vidéo phare de Runway offrant une sortie de qualité cinématique avec une cohérence exceptionnelle des personnages, des performances émotionnelles et des capacités de narration professionnelles.

Texte-vers-Vidéo
Vidéo

Runway Gen-4 Image

Runway

Le dernier modèle IA de Runway pour générer de la vidéo de qualité cinématique à partir d'images statiques, cohérence exceptionnelle des personnages, mouvement réaliste et narration professionnelle.

Image-vers-Vidéo
Vidéo

Seedance

ByteDance

Le modèle vidéo IA de ByteDance excellent dans l'animation expressive de personnages, la chorégraphie de danse et le mouvement humain avec support audio natif et génération multi-entrées.

Texte-vers-VidéoImage-vers-VidéoImages-vers-VidéoAudio Natif
Vidéo

Seedance 2.0

ByteDance

Le modèle vidéo IA multimodal de nouvelle génération de ByteDance, prend en charge images, vidéos, audio et texte simultanément. Offre un mouvement hyper-réaliste, des mouvements de caméra contrôlables, une synthèse audio native, une synchronisation au rythme musical et une extension vidéo transparente avec jusqu'à 12 assets par génération.

Texte-vers-VidéoImage-vers-VidéoVidéo-vers-VidéoAudio-vers-Vidéo+7 de plus
Image

Seedream

ByteDance

Le modèle de génération d'images IA haute qualité de ByteDance offrant une sortie vibrante et détaillée avec de fortes capacités texte-vers-image et image-vers-image jusqu'à une résolution 2K.

Texte-vers-ImageImage-vers-Image
Vidéo

Sora

OpenAI

Le modèle révolutionnaire de génération vidéo IA d'OpenAI capable de créer des vidéos imaginatives et de haute qualité à partir de prompts textuels avec une forte compréhension de l'espace 3D, de la physique et de la narration créative.

Texte-vers-VidéoImage-vers-Vidéo
Utilitaire

Topaz Image

Topaz Labs

Upscaling d'images IA de qualité professionnelle par Topaz Labs, amélioration de résolution jusqu'à 4x avec récupération intelligente des détails, réduction du bruit et suppression des artefacts.

Upscale d'ImageRécupération de DétailsRéduction du Bruit
Utilitaire

Topaz Video

Topaz Labs

Upscaling vidéo IA de qualité professionnelle par Topaz Labs, upscale de résolution vidéo jusqu'à 4x avec interpolation d'images, stabilisation et amélioration des détails.

Upscale VidéoInterpolation d'ImagesStabilisationAmélioration des Détails
Vidéo

Veo 3.1

Google DeepMind

Le modèle de génération vidéo de pointe de Google DeepMind offrant une sortie photoréaliste avec une précision physique de pointe, une synthèse audio native et une résolution 4K.

Texte-vers-VidéoImage-vers-VidéoImages-vers-VidéoRéférences-vers-Vidéo+1 de plus
Vidéo

Vidu Q2

Shengshu Technology

Le modèle de génération vidéo IA de Shengshu Technology offrant du texte-vers-vidéo et image-vers-vidéo haute fidélité avec une forte cohérence visuelle et une génération par référence.

Texte-vers-VidéoImage-vers-VidéoRéférences-vers-Vidéo
Vidéo

Vidu Q3

Shengshu Technology

Le dernier modèle vidéo IA de Shengshu Technology avec une qualité visuelle améliorée, une meilleure cohérence de mouvement et des capacités de génération supérieures par rapport à Vidu Q2.

Texte-vers-VidéoImage-vers-VidéoRéférences-vers-Vidéo
Vidéo

Wan 2.6

Alibaba

Le modèle de génération vidéo IA open source d'Alibaba offrant du texte-vers-vidéo et image-vers-vidéo de haute qualité avec une forte adhérence au prompt et des capacités de style diversifiées.

Texte-vers-VidéoImage-vers-Vidéo
Image

Z-Image Turbo

fal.ai

Génération d'images IA ultra-rapide optimisée pour la vitesse, temps de génération inférieur à la seconde pour le prototypage rapide, les flux de travail à haut volume et l'exploration visuelle instantanée.

Texte-vers-Image