采样(Sampling)
采样(Sampling)是什么?
采样是 AI 把随机噪声变成流畅图像或视频所用的数学过程:不同的采样方法在这一过程中走不同的路线,既影响结果的速度,也影响其质量。
一图看懂
- 别称
- 采样器(Sampler)调度器(Scheduler)采样方法推理采样
- 主要用途
- 通过从噪声到图像的迭代精修,从扩散模型产出输出通过采样器与步数选择,控制 AI 生成中的速度与质量权衡通过改变采样方式,从同一提示词产出不同的视觉特征理解为何生成质量与性格可独立于提示内容而变化
- 常用工具
- Stable diffusion WebUI (extensive sampler selection and step count controls)ComfyUI (node-based sampler configuration)Most advanced AI generation platforms (quality preset sliders abstracting sampling parameters)DPM++ solver, DDIM, euler, euler ancestral (common sampler implementations)
- 相关术语
- Diffusion modelSeedNoise / denoisingInferenceGuidance scaleSteps
- How it works in simple terms
- 模型从随机噪声出发,用预定的步数把它精修为流畅图像,由采样器决定它在每一步具体如何移动。步数越多意味着精修越多;采样器的选择决定了到达那里所走的数学路径。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
采样与提示词都是决定生成输出的输入,但它们作用于根本不同的层面。提示词决定模型试图生成什么:语义内容、风格与主体。采样器与步数决定模型如何穿越生成过程来产出这些内容:从噪声到图像的数学路径。两条相同的提示词搭配不同的采样器,会产出共享相同语义方向、但在细节质量、运动平滑度与美学性格上可能明显不同的输出。改变采样器改变的是旅程;改变提示词改变的是目的地。
可以这样理解…
采样就像穿过一座城市抵达同一目的地的不同路线,,DDIM 可能是高速公路,快速高效、绕路少;Euler Ancestral 可能是风景路线,走的步数更多,但沿途可能发现更有意思的诠释空间。目的地(提示词的语义目标)是相同的;路线(采样器)决定了你如何抵达,以及这趟旅程会产出什么。
实用提示
在使用暴露步数控制的平台时,不要想当然地认为最大步数总能为你的用例产出最佳结果。对探索性迭代而言,较低步数更快,且往往足以评估某个创作方向是否行得通。对最终生成而言,较高步数则值得多花时间。为你工作流的每个阶段找到能产出可接受质量的最小步数,是在不牺牲最终输出质量的前提下加快整体生成过程最实用的方法之一。
类型与变体
DDIM(Denoising Diffusion Implicit Models)是一种确定性采样器,通过让去噪过程可预测、可重复,从而在较低步数下也能得到不错的结果。Euler 与 Euler Ancestral 是被广泛使用的通用采样器,在多种步数下都能提供可靠质量。DPM++ 变体(DPM++ 2M、DPM++ SDE)因其在中等步数下的高效而受欢迎,常常是面向消费者的 AI 生成工具中的默认项。DDPM 是最初的扩散采样方法:更慢,但在足够步数下能达到高质量。流匹配(flow matching)用于较新的模型架构,以一种不同的方式应对同一问题,通常只需大幅减少的步数即可获得高质量输出。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
只要 AI 生成平台暴露了采样器或步数控制,采样配置就有意义,这在 Stable Diffusion WebUI 与 ComfyUI 等开源工具中很常见。理解采样有助于创作者解读质量预设:消费级平台上“草稿”“标准”“质量”这类标签,通常对应不同的步数设置,且可能搭配不同的采样器。在排查不稳定的生成结果、为迭代工作流阶段优化速度与质量平衡,以及对比可能使用不同默认采样配置的不同模型版本的输出时,它都有意义。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
采样是扩散模型产出输出的算法过程,在预定的步数内迭代地取值,把噪声精修为流畅的图像或视频。不同的采样方法对这一去噪过程采用不同的数学策略,在生成速度、输出质量与结果的视觉性格之间形成不同的权衡。
采样器(或调度器)是用于穿越每个去噪步骤的数学方法:它决定模型在每次迭代中如何从噪声朝最终输出移动。采样步数是所执行迭代的数量。两者相互作用:有的采样器 20 步即可达到好质量,有的需要 50 步。采样器选择决定路线;步数决定模型沿这条路线走多远。
大多数消费级平台把采样参数抽象在质量预设背后,因此你可能不会直接与它们打交道。不过,理解质量预设对应不同的采样配置,有助于解释为何“草稿”质量生成得比“高质量”快,以及为何在质量档之间切换改变的不仅是分辨率。当平台确实暴露了采样器控制时,这一概念基础能让你做出更明智的选择。
DDIM(Denoising Diffusion Implicit Models)是一种确定性采样方法,它让去噪过程可预测而非随机:相同的种子、提示与设置总会产出相同的输出。这种确定性使其能在比纯随机方法更低的步数下实现更快生成,使 DDIM 成为被广泛使用的默认采样器。它在较低步数下的高效,使其对生成速度至关重要的迭代工作流很实用。
更多步数让模型在生成过程中做更多迭代精修,通常产出更流畅、更细致、解析更佳的输出。更少步数产出更快的结果,但可能导致更粗糙或不那么忠实的输出。这种关系并非线性:往往存在一个收益递减的阈值,越过它之后额外步数带来的质量提升微乎其微。给定采样器与模型的最优步数应通过测试找到,而非单纯把步数拉满。
能。即便提示词、种子与步数完全相同,不同采样器也能产出共享相同语义方向、但在美学性格上明显不同的输出:细节肌理、边缘处理、视频中的运动质量,以及输出的整体视觉观感。这是因为不同采样器在同一概率空间中走不同的数学路径,得到对同一提示词不同但同样有效的诠释。
流匹配(flow matching)是一种较新的生成式建模取向,它应对与扩散采样相同的从噪声到图像的问题,但通过一套不同的数学框架:通常只需远少得多的步数即可达到高质量输出。使用流匹配的模型,可在少至四到八步内达到与多步扩散采样相当的结果,大幅缩短生成时间。许多较新的模型架构,包括一些用于顶尖视频生成的架构,使用的是流匹配而非传统扩散采样。
种子决定模型在采样开始前从哪个特定的随机噪声样式出发。采样器随后决定模型如何把那个特定噪声样式去噪为最终输出。用相同的种子搭配不同的采样器会产出不同的输出,因为相同的起始噪声经过了不同的数学路径处理。用不同的种子搭配相同的采样器,则会沿同一路径探索不同的起点,产出不同但风格相关的变体。