Échelle de guidage
Qu’est-ce que Échelle de guidage ?
L'échelle de guidance est un paramètre qui contrôle à quel point l'IA suit votre requête texte : augmentez-la et le modèle adhère plus strictement à votre description ; diminuez-la et le modèle prend plus de libertés créatives.
En un coup d’œil
- Aussi appelé
- éChelle CFGéChelle de classifier-free guidanceForce de la requête (dans certaines interfaces)
- Utilisé pour
- Contrôler l'adhérence à la requête en génération par modèle de diffusionéQuilibrer la précision littérale avec la qualité esthétiqueAjuster le comportement du modèle pour différents objectifs créatifs
- Outils courants
- Stable diffusionMidjourneyAUTOMATIC1111 WebUIComfyUIRunwayToute plateforme de génération basée sur la diffusion
- Termes liés
- Modèle de diffusionIngénierie de requêtesBruit / débruitageÉTapes d'échantillonnageEspace latent
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
Comparaison
l'échelle de guidance contrôle à quel point la requête influence chaque étape du processus de débruitage, affectant l'adhérence au contenu décrit dans le texte. Les étapes d'échantillonnage contrôlent combien d'itérations de débruitage le modèle effectue au total, affectant le détail et la cohérence de la sortie finale. Les deux paramètres interagissent : plus d'étapes donnent à l'échelle de guidance plus d'opportunités d'affiner la sortie, mais les deux contrôlent des aspects fondamentalement différents du processus de génération.
Astuce de pro
Lorsque vous ne parvenez pas à faire apparaître un élément spécifique de votre requête dans la sortie : un objet particulier, un détail d'arrière-plan ou un élément compositionnel : essayez d'augmenter l'échelle de guidance de deux ou trois unités avant de faire d'autres changements. Si la sortie semble alors dure ou sursaturée, vous avez trouvé la limite supérieure pour cette combinaison de requête et de modèle, et le problème est plus probablement lié à la formulation de la requête ou à la capacité du modèle qu'au réglage de guidance.
Types et variantes
- Différents modèles de diffusion ont différentes plages d'échelle de guidance efficaces.
- Les modèles comme Stable Diffusion 1.
- 5 fonctionnent généralement bien dans la plage 7–12, tandis que des architectures plus récentes comme SDXL et Flux peuvent mieux fonctionner à des valeurs plus basses.
- Certains modèles utilisent la classifier-free guidance sous des formes modifiées : par exemple, en l'appliquant différemment aux tokens d'image versus tokens de texte : ce qui peut changer le comportement effectif du paramètre d'échelle même lorsque sa plage numérique semble similaire.
- Certaines plateformes remplacent l'échelle numérique par des préréglages descriptifs, rendant l'ajustement de l'échelle de guidance plus accessible sans exposer le paramètre technique sous-jacent.
Prêt à créer votre première scène dans Morphic ?
Essayer MorphicCas d’usage courants
- Les créateurs ajustent l'échelle de guidance lorsque leurs sorties générées ne parviennent pas à inclure des éléments spécifiques décrits dans la requête : augmenter l'échelle fait souvent apparaître ces éléments plus systématiquement.
- Inversement, lorsque les images générées semblent dures, sursaturées ou rigides de manière non naturelle, abaisser l'échelle restaure souvent une qualité esthétique plus naturelle.
- Les modèles fine-tunés ou adaptés par LoRA peuvent nécessiter des échelles de guidance plus basses que les modèles de base car le fine-tuning a déjà spécialisé le prior du modèle vers le domaine de sortie souhaité, réduisant le besoin d'un fort guidage de requête.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.