Question 1

什么是AI图像生成中的嵌入?

Accepted Answer

嵌入是对某个视觉概念、风格或主体的紧凑数值表示,通过在一小组示例图像上训练而得到。它让创作者可以在生成提示词中加入训练好的触发词来引用习得的视觉特征,引导模型生成与嵌入概念一致的内容。

Question 2

嵌入与LoRA有何不同?

Accepted Answer

嵌入只修改引导生成的文本条件向量,在基础模型现有能力的范围内运作。LoRA训练额外的权重调整,直接应用于模型的各层,提供更全面的定制。嵌入更轻量、训练更快;LoRA提供更强、更灵活的结果。

Question 3

什么是文本反演?

Accepted Answer

文本反演是大多数Stable Diffusion嵌入背后的技术。它在一小组示例图像上训练一个新词元的嵌入向量,在模型的嵌入空间中找到最能捕捉主体视觉特征的位置,而不修改模型的权重。

Question 4

训练一个嵌入需要多少张图像?

Accepted Answer

文本反演用仅三到十张精心挑选的图像就能产生有用的结果。更多图像可以改善对主体不同方面的覆盖,但该技术专为只有少量示例可用的小样本场景而设计。

Question 5

什么是负向嵌入?

Accepted Answer

负向嵌入经过训练,用于表示创作者想要抑制而非鼓励的视觉品质。在生成时放入负向提示词字段中,它会降低嵌入特征出现在输出中的概率,起到可复用的质量过滤器的作用。

Question 6

在哪里可以找到Stable Diffusion的社区嵌入?

Accepted Answer

Civitai等社区平台托管着大量由Stable Diffusion社区分享的嵌入库,涵盖角色、风格与视觉概念。可以下载这些文件,放入正确的目录并在提示词中引用触发词,从而在个人生成环境中使用。

Question 7

嵌入与所有AI图像生成模型兼容吗?

Accepted Answer

在特定基础模型上训练的嵌入通常与该基础模型的微调变体兼容,但不与架构不同的模型兼容。在Stable Diffusion 1.5上训练的嵌入,未经重新训练无法在SDXL或其他架构不同的模型中使用。

Question 8

嵌入与更广义的AI嵌入概念之间是什么关系?

Accepted Answer

在更广义的AI领域中,嵌入是对离散对象的任何数值向量表示,用于捕捉其语义属性。图像生成模型中的文本编码器将提示词转换为嵌入向量。Stable Diffusion社区中的文本反演嵌入是这一通用原理的一种具体应用,用该技术将新的视觉概念表示为现有模型空间内的向量。

嵌入

嵌入是什么？