Question 1

AI 图像生成中的引导系数是什么？

Accepted Answer

引导系数是一个控制扩散模型输出遵循文本提示词紧密程度的参数。较高的数值促使模型更严格地遵循提示词；较低的数值则给予模型更多创意自由，借助其自身习得的美学感觉，这可以产生视觉上更自然但字面准确度较低的结果。

Question 2

AI 图像生成中的 CFG 代表什么？

Accepted Answer

CFG 代表无分类器引导，是扩散模型中引导系数背后的技术机制。它的工作原理是放大模型有条件输出（遵循提示词）与无条件输出（无方向地生成）之间的差异，从而在无需单独分类器模型的情况下，将生成引向所提示的内容。

Question 3

如果引导系数过高会发生什么？

Accepted Answer

在非常高的引导系数数值下，输出往往会变得过饱和、视觉上刺眼且人为锐利，其质感有时被形容为“烧焦”。模型对提示词的每个元素都独立地过度投入，而未能自然地加以平衡，常常生成显得过度逼真或塑料感的图像，而非协调的画面。

Question 4

如果引导系数过低会发生什么？

Accepted Answer

在非常低的数值下，模型在很大程度上忽略提示词，转而依据其自身习得的先验来生成图像，这可能在美学上悦目，但不会与所描述的内容相符。提示词中所要求的特定主体、物体或构图元素，可能在输出中缺失或含糊。

Question 5

起始时用多大的引导系数比较好？

Accepted Answer

对大多数基于 Stable Diffusion 的模型而言，7 到 12 之间的数值是一个合理的起点，而 Flux 等较新架构在 2–5 范围的较低数值下往往表现更佳。最佳数值取决于具体模型、提示词复杂度和期望的美学，因此在所用模型的有效范围内进行试验，是最可靠的做法。

Question 6

引导系数除了影响图像，也会影响视频生成吗？

Accepted Answer

引导系数对视频扩散模型的作用方式与图像模型相同，控制生成视频在每个去噪步骤遵循文本提示词的紧密程度。在视频生成中，引导系数与时间一致性之间的相互作用可能比静态图像工作更复杂，不同的视频模型可能具有更窄的有效引导范围。

Question 7

所有 AI 生成工具中的引导系数都一样吗？

Accepted Answer

其底层概念在各种基于扩散的模型中是一致的，但有效数值范围、默认值以及参数的标注方式，会因工具和模型架构而异。在一个模型中算高的引导系数，在另一个模型中可能表现不同，因此理解所用模型的具体行为，比套用一个通用规则更有帮助。

Question 8

引导系数能补救糟糕的提示词吗？

Accepted Answer

引导系数调节模型遵循提示词的强度，但无法弥补一条含糊、矛盾或超出模型能力的提示词。如果所描述的概念在模型训练数据中没有得到充分表征，提高引导系数只会强行得到一个更坚决但仍然错误的解读。改进提示词本身，始终比单独调整引导系数更有效。

引导系数

引导系数是什么？