引导系数
引导系数是什么?
引导系数是一个控制 AI 遵循文本提示词紧密程度的设置:调高它,模型会更严格地贴合你的描述;调低它,模型则会更多地自由发挥创意。
一图看懂
- 别称
- CFG 系数无分类器引导系数提示词强度(在某些界面中)
- 主要用途
- 在扩散模型生成中控制提示词遵从度在字面准确性与美学质量之间取得平衡针对不同创作目标调校模型行为
- 常用工具
- Stable diffusionMidjourneyAUTOMATIC1111 WebUIComfyUIRunwayAny diffusion-based generation platform
- 相关术语
- Diffusion modelPrompt engineeringNoise / denoisingSampling stepsLatent space
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
引导系数与采样步数:引导系数控制提示词对去噪过程每一步的影响强度,影响对文本所述内容的遵从程度。采样步数控制模型总共执行多少次去噪迭代,影响最终输出的细节和流畅度。两个参数相互作用:更多的步数给引导系数更多优化输出的机会,但二者控制的是生成过程中根本不同的方面。
实用提示
当你无法让提示词中的某个特定元素(某个物体、背景细节或构图元素)出现在输出中时,在做其他更改之前,先尝试将引导系数提高两到三个单位。如果输出随后显得刺眼或过饱和,那你就找到了该提示词与模型组合的上限,问题更可能出在提示词措辞或模型能力上,而非引导设置。
类型与变体
不同的扩散模型有不同的有效引导系数范围。Stable Diffusion 1.
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
当生成的输出未能包含提示词中所描述的特定元素时,创作者会调整引导系数:提高数值往往能让这些元素更稳定地出现。反之,当生成图像显得刺眼、过饱和或不自然地僵硬时,降低数值往往能恢复更自然的美学质感。经过微调或 LoRA 适配的模型可能需要比基础模型更低的引导系数,因为微调已将模型的先验专门化到所需的输出领域,从而减少了强力提示词引导的必要。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
引导系数是一个控制扩散模型输出遵循文本提示词紧密程度的参数。较高的数值促使模型更严格地遵循提示词;较低的数值则给予模型更多创意自由,借助其自身习得的美学感觉,这可以产生视觉上更自然但字面准确度较低的结果。
CFG 代表无分类器引导,是扩散模型中引导系数背后的技术机制。它的工作原理是放大模型有条件输出(遵循提示词)与无条件输出(无方向地生成)之间的差异,从而在无需单独分类器模型的情况下,将生成引向所提示的内容。
在非常高的引导系数数值下,输出往往会变得过饱和、视觉上刺眼且人为锐利,其质感有时被形容为“烧焦”。模型对提示词的每个元素都独立地过度投入,而未能自然地加以平衡,常常生成显得过度逼真或塑料感的图像,而非协调的画面。
在非常低的数值下,模型在很大程度上忽略提示词,转而依据其自身习得的先验来生成图像,这可能在美学上悦目,但不会与所描述的内容相符。提示词中所要求的特定主体、物体或构图元素,可能在输出中缺失或含糊。
对大多数基于 Stable Diffusion 的模型而言,7 到 12 之间的数值是一个合理的起点,而 Flux 等较新架构在 2–5 范围的较低数值下往往表现更佳。最佳数值取决于具体模型、提示词复杂度和期望的美学,因此在所用模型的有效范围内进行试验,是最可靠的做法。
引导系数对视频扩散模型的作用方式与图像模型相同,控制生成视频在每个去噪步骤遵循文本提示词的紧密程度。在视频生成中,引导系数与时间一致性之间的相互作用可能比静态图像工作更复杂,不同的视频模型可能具有更窄的有效引导范围。
其底层概念在各种基于扩散的模型中是一致的,但有效数值范围、默认值以及参数的标注方式,会因工具和模型架构而异。在一个模型中算高的引导系数,在另一个模型中可能表现不同,因此理解所用模型的具体行为,比套用一个通用规则更有帮助。
引导系数调节模型遵循提示词的强度,但无法弥补一条含糊、矛盾或超出模型能力的提示词。如果所描述的概念在模型训练数据中没有得到充分表征,提高引导系数只会强行得到一个更坚决但仍然错误的解读。改进提示词本身,始终比单独调整引导系数更有效。