在机器学习与 AI 中,参数是指定义已训练模型行为的内部数值(权重与偏置)。它们是模型“所知内容”的核心:训练过程的产物,编码了模型通过暴露于海量训练数据所发现的输入与输出之间的统计关系。每当神经网络处理一次输入时,它都会借助这些参数,通过网络架构对输入值进行乘法、加法与变换运算,产出能够反映模型对该类输入所学关联的输出。在训练之前,参数被初始化为较小的随机值;在训练过程中,这些参数会通过优化方法被反复调整,以最小化模型输出与正确输出之间的差距。训练完成后,参数被固定下来,构成保存的模型:即用户通过生成工具与之交互的文件或系统。
模型的参数数量经常被用作衡量其规模与能力的指标。当代大型语言模型与图像生成模型包含数十亿乃至更多参数(GPT-3 拥有 1750 亿,更大的模型超过万亿),这反映出以高质量建模自然语言、图像或视频复杂性所需的表征容量规模。然而,参数数量本身并非衡量质量或能力的完整指标:架构设计、训练数据质量、训练方法以及具体任务领域,都会显著影响给定数量的参数能够实现的成果。一个在高质量、领域特定数据上训练的较小模型,在该领域的特定任务上有可能胜过远比它更大的通用模型。参数使用效率(每个参数所贡献的能力多寡)是 AI 研究的活跃方向,稀疏模型与专家混合(Mixture-of-Experts)等架构创新使得在不按比例增加单次推理所用参数数量的前提下,获得更大的有效容量成为可能。
在 AI 生成工具的语境下,“参数”一词在日常用法中还具有第二层更为通俗的含义:生成平台界面所暴露的、可由用户调节的设置与控件——CFG scale、步数、种子、噪声水平、采样器及类似数值——常被口语化地称为“生成参数”或“提示词参数”。这种用法在技术上有别于模型参数(后者在训练完成后被固定,无法由用户调整),但该词的两种含义都描述了塑造输出的数值:模型参数决定模型能够做什么;生成参数决定模型的能力如何被应用到具体的生成任务上。理解这两种用法(及其相互关系)是有效使用 AI 生成系统的基础。