在 AI 图像与视频生成(尤其是扩散模型)的语境中,噪声(Noise)指添加到或存在于图像数据中的随机统计变化:在数学性质上类似于未调谐模拟电视的雪花画面或欠曝胶片的颗粒。在扩散模型中,噪声在生成过程中扮演特定且核心的角色:模型被训练去逆转一个加噪过程,学习如何从带噪图像中逐步去除噪声,直至产生一幅清晰、可辨识的图像。生成从纯噪声开始:一个与目标图像同维度的随机值张量:模型在一系列步骤中迭代预测并去除该噪声的分量,在文本提示词或其他条件信号的引导下,从最初的完全随机中产出结构性、连贯的图像。这一去噪过程在任一时刻的噪声水平表示当前剩余的噪声量,初始步骤为最大噪声,最终步骤则为完全解析出的图像。
噪声水平在若干场景中成为用户可控参数。当从一张起始图像(而非纯噪声)开始生成(即图像生成图像,image-to-image)时,噪声水平(常被称为去噪强度,denoising strength;或 img2img 强度)控制在去噪过程开始前对输入图像所添加噪声的多少。高噪声水平意味着加入更多噪声,给予模型更大的自由度在重建时偏离原图:本质上是对输入更强力的变换。低噪声水平意味着加入更少噪声,使模型输出更接近原图:是一种更保守的变换。该参数是图像生成图像工作流的根本:它决定了在保留输入图像结构与允许模型根据提示词对其重新诠释之间的平衡。在极低噪声水平下,输出紧贴输入图像的构图与结构;在极高噪声水平下,输出仅以输入作为松散参考,提示词引导成为主导。
噪声水平还会与生成过程的步数相互作用。更多去噪步数允许模型在去除噪声时进行更细致、更增量式的调整,通常产生更高质量、更具细节的输出:但代价是更长的计算时间。更少步数能得到更快的结果,但可能缺乏精细细节,或因更粗糙的去噪分辨率出现可见瑕疵。噪声计划(noise schedule):即模型在去噪步骤中从高噪声过渡到低噪声的快慢与节奏:是影响生成质量与风格的另一参数,由所选的采样器算法管理。在此语境下理解噪声与噪声水平,有助于用户理解某些生成行为发生的原因:为何在高强度下的图像生成图像变换会如此显著地偏离输入;为何更多步数往往能提升细节;以及为何同一提示词会因随机起始噪声(即种子)的不同而产生明显不同的结果。