Question 1

什么是 DreamBooth?

Accepted Answer

DreamBooth 是一种微调技术,用一组通常为三到三十张、描绘特定主体的小型图像集来训练现有的AI图像生成模型。训练好的模型随后可在提示词描述的任何语境、风格或姿态中生成该主体。

Question 2

训练一个 DreamBooth 模型需要多少张图像?

Accepted Answer

DreamBooth 用少至三到五张图像就能得到基本效果,但十到三十张精心筛选、多样的图像通常能产生更灵活、更一致的输出。图像质量与多样性比数量更重要。

Question 3

DreamBooth 是谁开发的?

Accepted Answer

DreamBooth 由谷歌的研究人员开发,并在2022年发表的一篇论文中描述。此后它被开源AI图像生成社区广泛采用与改进。

Question 4

DreamBooth 和 LoRA 有什么区别?

Accepted Answer

DreamBooth 产生一个完整的微调模型检查点,通常能实现全面的个性化。LoRA 训练一小组额外权重,叠加在基础模型之上,所需存储与训练时间更少。结合 LoRA 的 DreamBooth 兼采两者之长,在质量与效率之间取得平衡。

Question 5

DreamBooth 可以用来训练什么?

Accepted Answer

DreamBooth 可以在特定人物、角色、产品、艺术风格、宠物、物体,以及任何具有独特视觉特征、需要在多样生成语境中可复现的主体上训练模型。

Question 6

DreamBooth 适用于任何AI图像模型吗?

Accepted Answer

DreamBooth 最常应用于基于 Stable Diffusion 的模型及其变体,其开源模型权重可在本地或通过云训练服务进行微调。它不适用于无法访问底层权重的专有闭源模型。

Question 7

DreamBooth 训练需要多长时间?

Accepted Answer

训练时间因硬件、数据集大小与训练参数而异,但一次标准的 DreamBooth 运行在消费级或云端GPU硬件上通常需要十五分钟到数小时。结合 LoRA 的 DreamBooth 一般比完整权重的 DreamBooth 训练更快。

Question 8

DreamBooth 训练中的先验保留损失是什么?

Accepted Answer

先验保留损失是 DreamBooth 训练中使用的一种技术,在主体图像之外加入额外的通用类别图像,防止微调削弱模型生成该主体所属通用类别的能力。例如,在训练特定人物时纳入通用人像图像,以防模型遗忘通用人像应有的样子。

DreamBooth

DreamBooth是什么？