Stable Diffusion
Qu’est-ce que Stable Diffusion ?
Stable Diffusion est un modèle IA gratuit et open-source qui génère des images à partir de descriptions textuelles, et parce que n'importe qui peut le télécharger et le modifier, il est devenu la base d'un grand nombre d'outils créatifs IA.
En un coup d’œil
- Type of model
- Modèle open-source de diffusion latente texte-vers-image
- Developed by
- Stability AI, avec des contributions de recherche de LMU Munich et Runway ML
- Key capability
- Génération texte-vers-image de haute qualité, img2img, inpainting et outpainting ; architecture fondamentale pour un large écosystème de modèles fine-tunés et d'extensions
- How it fits in AI workflow
- Utilisé pour la génération d'images, l'art conceptuel, la conception de personnages et d'environnements, le raffinement img2img, le support de compositing, et comme architecture de base pour de nombreux outils spécialisés de génération d'images et vidéo
- Termes liés
- Diffusion modelCLIPLoRAControlNetLatent spaceMidjourneyAUTOMATIC1111
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
Comparaison
Stable Diffusion est open-source, peut être exécuté localement, et offre une personnalisation profonde par fine-tuning et extensions, tandis que Midjourney est un service hébergé propriétaire sans déploiement local. Midjourney produit généralement des résultats esthétiquement plus aboutis dès le départ avec moins d'effort de prompting, tandis que Stable Diffusion offre un contrôle technique, une personnalisation et une flexibilité bien plus grands pour les workflows professionnels et de recherche.
Astuce de pro
Pour une génération de personnage cohérente à travers une production, entraînez un LoRA sur dix à vingt images de votre personnage en utilisant Stable Diffusion, puis utilisez ce LoRA à travers toutes les générations d'images : cela vous donne une identité de personnage bien plus fiable que les descriptions de prompt seules et constitue la technique standard pour les workflows de cohérence de personnages IA.
Types et variantes
- Stable Diffusion a été lancé en plusieurs versions majeures : SD 1.
- 4, SD 1.
- 5, SD 2.
- 0, SD 2.
- 1, SDXL (Stable Diffusion XL) et Stable Diffusion 3.
- Chaque version a apporté des améliorations en résolution, adhérence au prompt et qualité d'image.
- La communauté a produit des milliers de checkpoints fine-tunés spécialisés pour le photoréalisme, l'anime, l'art conceptuel et de nombreuses autres esthétiques.
- Les adaptateurs LoRA permettent un fine-tuning léger pour des personnages, styles et sujets spécifiques.
- ControlNet ajoute un conditionnement spatial utilisant des cartes de contours, cartes de profondeur et entrées de pose pour un plus grand contrôle compositionnel.
Prêt à créer votre première scène dans Morphic ?
Essayer MorphicCas d’usage courants
Stable Diffusion est utilisé pour générer de l'art conceptuel et des assets de développement visuel, créer des personnages IA cohérents par entraînement LoRA, produire de l'imagerie d'arrière-plan et d'environnement, raffiner des esquisses ou images de référence par img2img, faire de l'inpainting et outpainting pour l'édition et l'extension d'images, générer des frames de storyboard, produire des textures et assets pour les workflows 3D et de compositing, et comme couche de fondation pour les pipelines d'images IA personnalisés.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
FAQ
Stable Diffusion est un modèle IA open-source qui génère des images à partir de prompts textuels en utilisant un processus de diffusion latente. Il a été lancé en 2022 par Stability AI et est devenu l'une des fondations les plus largement utilisées pour la génération d'images IA.
Oui : les poids du modèle Stable Diffusion sont librement disponibles au téléchargement et à l'utilisation. L'exécuter localement nécessite un matériel GPU adapté. De nombreux outils basés sur le web qui utilisent Stable Diffusion offrent un accès gratuit ou par abonnement sans nécessiter de configuration locale.
Différentes versions ( SD 1.5, SD 2.1, SDXL et SD 3 ) offrent chacune des améliorations en qualité d'image, résolution, compréhension du prompt et conception architecturale. SD 1.5 reste largement utilisé en raison de sa grande bibliothèque communautaire de fine-tunes ; SDXL et SD 3 offrent une résolution plus élevée et une qualité améliorée.
LoRA (Low-Rank Adaptation) est une méthode de fine-tuning léger utilisée avec Stable Diffusion pour entraîner le modèle sur un petit ensemble d'images et l'adapter pour générer des personnages, styles ou objets spécifiques de manière cohérente. Les LoRAs sont de petits fichiers qui peuvent être partagés et appliqués au modèle de base.
ControlNet est une extension pour Stable Diffusion qui ajoute un conditionnement spatial : utilisant des cartes de contours, cartes de profondeur, squelettes de pose et autres entrées structurées : pour donner aux créateurs un contrôle bien plus précis sur la composition et la structure des images générées.
Stable Diffusion lui-même est principalement un modèle de génération d'images, mais des projets connexes comme AnimateDiff utilisent des checkpoints Stable Diffusion avec un module de mouvement ajouté pour générer de courts clips animés. Des modèles de génération vidéo dédiés tels que Stable Video Diffusion étendent l'approche à la vidéo.