Question 1

模型训练需要多长时间?

Accepted Answer

对一个大型基础模型进行完整预训练,可能需要在数百块 GPU 组成的集群上运行数周到数月,耗资数百万英镑。相比之下,在消费级 GPU 上微调一个个人 LoRA 模型,视数据集规模与硬件不同,可能只需二十分钟到几个小时。

Question 2

训练 AI 图像与视频模型使用什么数据?

Accepted Answer

大多数大型图像生成模型是在从互联网抓取的数十亿个图文对上训练的。视频模型还增加了时间数据:带有相关字幕或元数据的帧序列。训练数据的具体构成因模型而异,且往往不被开发者完全披露。

Question 3

什么是过拟合,它为何对微调很重要?

Accepted Answer

过拟合发生在模型过于死板地记住训练数据、丧失泛化能力之时。在创意用途的微调中,过拟合的模型可能过于字面地复现你的参考图像,在应对多样提示词时失去灵活性。控制训练步数与数据多样性有助于避免这一问题。

Question 4

没有研究背景能训练自己的 AI 模型吗?

Accepted Answer

可以:LoRA 这类参数高效的微调方法已通过带图形界面的工具与详尽的社区指南变得易于上手。从零进行完整预训练仍属资源充裕团队的领域,但有意义的定制对于技术上有好奇心的创作者来说是触手可及的。

Question 5

训练与微调有何区别?

Accepted Answer

训练(或预训练)在海量数据集上从头构建模型的能力。微调则取一个已训练好的模型,在更小、更特定的数据集上继续训练,以使其行为专门化:这比从零训练便宜且快得多。

Question 6

训练数据如何影响 AI 输出中的偏差?

Accepted Answer

模型会反映其训练数据中存在的模式。如果数据过度代表某些人群、美学或文化视角,模型就会在其输出中复现这些偏差。这是 AI 发展中一项重大且持续的挑战,对于用于面向公众的创意制作的模型尤为突出。

模型训练

模型训练是什么？