嵌入
嵌入是什么?
嵌入是对某个概念、风格或主体的紧凑数值表示,AI模型可借助它来引导图像生成,它通过在一小组示例上训练而得到。
一图看懂
- 别称
- 文本反演嵌入TI嵌入习得词元概念嵌入
- 主要用途
- 编码特定的视觉风格或主体,供生成提示词使用无需完整微调即可实现轻量级模型定制为生成工作流程添加重复出现的角色或美学概念以紧凑文件形式在社区中分享视觉风格与主体
- 常用工具
- Stable diffusion with textual inversion trainingAUTOMATIC1111 embedding training interfaceCommunity embedding libraries
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
嵌入与LoRA对比:嵌入只修改用于引导生成的文本条件向量,在基础模型已知如何生成的约束内运作。LoRA则训练额外的权重调整,直接应用于模型的处理层,提供更全面、更灵活的定制,因为它修改的是模型处理信息的方式,而不只是给它的提示内容。嵌入更轻量、训练更快;LoRA提供更强、更可靠的定制,尤其对基础模型训练中表现不足的主体而言。
实用提示
在Stable Diffusion工作流程中使用社区嵌入时,请在提示词中以不同的权重值测试每个嵌入,例如(embedding_name:0.8)或(embedding_name:1.2),而不要总是使用默认的1.0权重。有些嵌入是在不同强度下训练的,在略高于或略低于默认值的权重下表现更好。从0.7开始,以0.1为步长逐步提升,可以快速找出能让嵌入概念与提示词其余部分融合得最理想的权重。
类型与变体
主体嵌入编码特定人物、角色或物体的视觉身份,通过在提示词中加入训练好的词元便可将其唤出。风格嵌入捕捉某种艺术风格、插画技法或视觉品质的美学特征,随后可应用于任何生成内容。负向嵌入经过训练用于表示创作者想要抑制而非鼓励的视觉品质,放在负向提示词字段中,以降低特定不需要的特征出现在生成结果中的概率。在更大词元预算上训练的多向量嵌入可以捕捉更复杂的概念,但代价是需要更多训练资源。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
为重复出现的角色或品牌元素创建轻量嵌入,无需完整的DreamBooth训练即可在提示词中引用。在Stable Diffusion社区内,以小巧的嵌入文件形式分享某种艺术风格或美学品质。构建风格与主体嵌入的库,可在提示词中组合使用,实现灵活的模块化生成控制。使用负向嵌入,在所有生成结果中抑制常见的生成瑕疵、解剖错误或不需要的视觉特征。将特定视觉品质(例如某种胶片颗粒、色彩处理或构图倾向)编码为嵌入,以便在整个项目中一致地应用。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
嵌入是对某个视觉概念、风格或主体的紧凑数值表示,通过在一小组示例图像上训练而得到。它让创作者可以在生成提示词中加入训练好的触发词来引用习得的视觉特征,引导模型生成与嵌入概念一致的内容。
嵌入只修改引导生成的文本条件向量,在基础模型现有能力的范围内运作。LoRA训练额外的权重调整,直接应用于模型的各层,提供更全面的定制。嵌入更轻量、训练更快;LoRA提供更强、更灵活的结果。
文本反演是大多数Stable Diffusion嵌入背后的技术。它在一小组示例图像上训练一个新词元的嵌入向量,在模型的嵌入空间中找到最能捕捉主体视觉特征的位置,而不修改模型的权重。
文本反演用仅三到十张精心挑选的图像就能产生有用的结果。更多图像可以改善对主体不同方面的覆盖,但该技术专为只有少量示例可用的小样本场景而设计。
负向嵌入经过训练,用于表示创作者想要抑制而非鼓励的视觉品质。在生成时放入负向提示词字段中,它会降低嵌入特征出现在输出中的概率,起到可复用的质量过滤器的作用。
Civitai等社区平台托管着大量由Stable Diffusion社区分享的嵌入库,涵盖角色、风格与视觉概念。可以下载这些文件,放入正确的目录并在提示词中引用触发词,从而在个人生成环境中使用。
在特定基础模型上训练的嵌入通常与该基础模型的微调变体兼容,但不与架构不同的模型兼容。在Stable Diffusion 1.5上训练的嵌入,未经重新训练无法在SDXL或其他架构不同的模型中使用。
在更广义的AI领域中,嵌入是对离散对象的任何数值向量表示,用于捕捉其语义属性。图像生成模型中的文本编码器将提示词转换为嵌入向量。Stable Diffusion社区中的文本反演嵌入是这一通用原理的一种具体应用,用该技术将新的视觉概念表示为现有模型空间内的向量。