文本反演(Textual Inversion)
文本反演(Textual Inversion)是什么?
文本反演向 AI 生成模型教授一个代表某一具体视觉概念的新词,这样你就能在提示中使用这个词来稳定地生成该概念。
一图看懂
- 别称
- 嵌入训练文本嵌入微调概念嵌入
- 主要用途
- 用自定义主体个性化 AI 图像生成向模型教授特定的艺术风格把品牌或专有的视觉概念加入模型的词汇创建可在工作流之间共享的可复用概念嵌入
- Key features
- 只训练一个新的文本嵌入,而非整个模型只需少量参考图像产出体积小、易于分享的嵌入文件底层模型能力保持完好无损
- 相关术语
- DreamBoothLoRAFine-tuningModel trainingPrompt engineering
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
文本反演与 DreamBooth 都为自定义概念而对 AI 生成模型进行个性化,但在深度与路线上差异显著。文本反演只修改一个新的 token 嵌入,完全不改动模型权重,这限制了它捕捉高度具体相貌的能力,却保留了模型的全部灵活性。DreamBooth 则在参考图像上对整个模型进行微调,产出更强、更准确的概念捕捉(尤其是针对特定人脸与复杂主体),代价是更高的算力开销,以及一个更大、可移植性更差的产物。对于风格捕捉与简单直接的物体概念,文本反演往往已经足够;而对于精确的相貌保真度,DreamBooth 通常是更强的选择。
可以这样理解…
文本反演就像在词典里添加一个新词条,只不过配的是一张图片而非一段释义:你在向 AI 教授一个新词在视觉上意味着什么,这样每当你在提示中使用这个词,它就知道该生成什么。
实用提示
为某种视觉风格创建文本反演嵌入时,使用那些在标志性特征上保持一致、但在主体与构图上各有不同的参考图。如果所有参考图都展示同一主体的同一姿势,模型可能会把风格与主体混为一谈,产出一个只会生成那个特定主体、而非把风格应用到新主体上的嵌入。
类型与变体
文本反演可以根据所提供的训练图像,捕捉不同类型的概念。风格嵌入在共享某种独特美学的图像上训练:某位艺术家的视觉手法、某种历史插画风格,或某套品牌图形语言,从而让该风格得以应用到任意所描述的主体上。物体嵌入捕捉某一具体的产品、道具或物件,以便一致地复现。主体嵌入试图捕捉某个人物或角色的相貌,不过对于这一用例,DreamBooth 通常优于文本反演。多 token 嵌入则把这一方法拓展为联合使用多个新 token,以表示单个 token 难以稳定承载的更复杂或更微妙的概念。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
文本反演在创意 AI 工作流中被广泛用于个性化与风格一致性。品牌与产品团队为特定产品创建嵌入,以生成营销图像。艺术家与插画师为自己的视觉风格创建嵌入,把 AI 输出导向其美学。概念艺术家把专有的角色或世界观设计参照加入自己的生成工具箱。社区创作者分享代表艺术风格与美学概念的嵌入,构建起其他创作者可以借力的共享词汇。该技术还被用于迭代式制作工作流:在其中,某个一致的视觉元素(反复出现的角色、某个特定环境、某种独特的灯光风格)需要在众多次生成之间被稳定复现。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。