Question 1

AI 模型中的参数是什么?

Accepted Answer

参数是定义已训练 AI 模型行为的内部数值(主要是权重与偏置)。它们编码了模型从训练数据中学到的全部内容,并决定模型如何把任意给定输入转化为输出。训练完成后,参数被固定,构成保存下来的模型。现代大型模型包含数十亿个参数。

Question 2

参数与超参数有什么区别?

Accepted Answer

参数是在训练过程中学习得到的数值:即网络内部的权重与偏置,它们通过训练过程被调整以最小化误差。超参数是定义训练过程本身的设置(学习率、批大小、训练步数),在训练开始之前就被设定,而不是从数据中学习得到。参数是训练的产物;超参数则塑造训练如何进行。

Question 3

参数越多就一定意味着模型越好吗?

Accepted Answer

不一定。参数越多意味着表征容量越大:模型有潜力学到更复杂、更细致的模式,但质量同样高度依赖训练数据质量、架构设计与训练方法。一个在优质、经过精选的领域特定数据上训练的较小模型,在该领域内的特定任务上有可能胜过一个大得多的通用模型。参数数量是规模的指标,而非质量或对某个具体用例适配程度的保证。

Question 4

什么是模型权重?

Accepted Answer

权重是一类特定的参数,用于定义神经网络中神经元之间连接的强度:它是数量最多、也最重要的一类参数。在日常用法中,“模型权重”与“模型参数”常被互换使用,指代定义已训练模型的那一整套学习到的数值。当一个模型被下载或共享时,传输的文件中包含的正是这些权重。

Question 5

生成参数是什么?它与模型参数有何不同?

Accepted Answer

生成参数(也称推理参数或采样参数)是生成界面中用户可调的设置(CFG scale、步数、种子、噪声水平、采样器),用于控制已训练模型如何被应用到具体的生成任务上。模型参数是固定的、学习得来的内部数值,定义了模型能做什么。生成参数塑造模型的能力如何被表达;模型参数则定义这些能力本身是什么。

Question 6

“微调”会对模型的参数做什么?

Accepted Answer

微调以预训练模型已有的参数为起点,在一个更小、更专门的数据集上继续训练过程,进一步调整参数以提升在该特定领域或任务上的表现。其结果是一个微调后的模型,其参数同时编码了预训练阶段学到的广泛能力,以及微调阶段发展出的专门知识。由于预训练参数提供了强有力的起点,微调在算力上的开销显著低于从零开始训练。

Question 7

为什么更大的模型需要更多内存与算力?

Accepted Answer

每个参数都需要内存来存储,并在推理时需要计算来应用。一个拥有 700 亿参数的模型,以 16 位精度存储约需 140GB 内存(每个参数存储为 2 字节数值)。让一个输入穿过 70B 模型需要执行数十亿次数学运算,这就要求强大的硬件。这也是为什么超大型模型通常运行在配备专用硬件的云端基础设施上,而非消费级设备上。

Question 8

用户能访问或更改模型的参数吗?

Accepted Answer

在标准的消费级界面中不能。在通常的使用中,模型参数是固定且无法访问的:用户通过提示词与生成参数与模型交互,而不直接触及底层权重。能够访问模型文件并具备相应硬件的高级用户可以进行微调,即通过额外训练来调整参数。一些平台和诸如 LoRA 这样的技术提供了更易上手的参数调整方法,它们高效地修改一小部分参数。

参数(Parameters)

参数(Parameters)是什么？

执导场景、设计角色、完成整部影片

类型与变体

准备好在 Morphic 里做第一个场景了吗？

常见使用场景

执导场景、设计角色、完成整部影片

常见问题（FAQ）