模型训练
模型训练是什么?
模型训练是 AI 学习的方式:向它展示海量数据,它做出猜测、被纠正,逐步改进,直到能可靠地完成某项任务。训练的结果是模型的权重:它带入此后每一次交互的存储知识。
一图看懂
- 别称
- 模型学习神经网络训练微调(用于专门化训练)
- 主要用途
- 从零构建 AI 能力在自定义风格上微调模型为特定任务适配基础模型
- 常用工具
- PyTorchTensorFlowHugging faceKohya SSReplicate
- 相关术语
- Model architectureFine-tuningLoRAOverfittingDatasetInference
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
模型训练与推理的对比:训练是教会模型的过程,它计算成本高、耗时长,发生在模型部署之前。推理是使用已训练模型产出输出的过程,它快得多、便宜得多,每当你向 AI 工具输入提示词时发生的就是推理。
可以这样理解…
模型训练就像学生长期备考。每一道练习题都是一份训练数据;每一个错误答案都引出一次纠正,调整学生的理解。在足够多的学习之后,学生内化了模式,能够回答此前未曾见过的新问题。训练完成的模型就像复习结束时的那位学生:已准备好在真实世界中接受检验。
实用提示
在用你自己的图像微调模型以实现一致的角色或风格生成时,要优先考虑图像的多样性而非数量:二十张多样、高质量的参考图像通常比一百张几乎雷同的图像产出更好的结果,因为模型需要从多个角度、在不同的灯光条件下理解主体,才能良好地泛化。
类型与变体
模型训练涵盖几个不同的过程。预训练指在海量、广覆盖的数据集上从零训练模型,赋予其通用能力。监督微调指在带标签的示例上进一步训练,使模型专门化于某一特定任务。基于人类反馈的强化学习(RLHF)利用人类偏好信号,使模型行为与期望输出对齐。参数高效的微调方法(如 LoRA)只训练一小部分权重,使定制无需完整计算基础设施即可进行。自监督学习被许多大型基础模型采用,它从数据自身的结构而非明确的人工标签中获取训练信号。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
在创意 AI 工作流中,模型训练最常以微调的形式出现:在一组参考图像上训练一个基础图像或视频生成模型,以捕捉某个特定角色的面孔、某种特定的视觉风格或某个品牌的美学。Replicate、RunPod 这样的平台以及 Kohya SS 这类专门工具,使个人创作者能够运行微调任务。训练也隐含地处于每一款用于制作的 AI 工具的核心:Sora、Stable Diffusion、Midjourney 及同类工具的能力,都是其训练数据与过程的直接产物。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
对一个大型基础模型进行完整预训练,可能需要在数百块 GPU 组成的集群上运行数周到数月,耗资数百万英镑。相比之下,在消费级 GPU 上微调一个个人 LoRA 模型,视数据集规模与硬件不同,可能只需二十分钟到几个小时。
大多数大型图像生成模型是在从互联网抓取的数十亿个图文对上训练的。视频模型还增加了时间数据:带有相关字幕或元数据的帧序列。训练数据的具体构成因模型而异,且往往不被开发者完全披露。
过拟合发生在模型过于死板地记住训练数据、丧失泛化能力之时。在创意用途的微调中,过拟合的模型可能过于字面地复现你的参考图像,在应对多样提示词时失去灵活性。控制训练步数与数据多样性有助于避免这一问题。
可以:LoRA 这类参数高效的微调方法已通过带图形界面的工具与详尽的社区指南变得易于上手。从零进行完整预训练仍属资源充裕团队的领域,但有意义的定制对于技术上有好奇心的创作者来说是触手可及的。
训练(或预训练)在海量数据集上从头构建模型的能力。微调则取一个已训练好的模型,在更小、更特定的数据集上继续训练,以使其行为专门化:这比从零训练便宜且快得多。
模型会反映其训练数据中存在的模式。如果数据过度代表某些人群、美学或文化视角,模型就会在其输出中复现这些偏差。这是 AI 发展中一项重大且持续的挑战,对于用于面向公众的创意制作的模型尤为突出。