参考图(Reference Image)
参考图(Reference Image)是什么?
参考图是你提供给 AI 模型、用于引导生成内容的一张图像:它直接向模型展示你想要的风格、人物、构图或视觉质感,而不只是用文字去描述。
一图看懂
- 别称
- 图像参考视觉参考图像提示风格参考
- 主要用途
- 传达难以用文字描述的视觉风格、色彩与美学质感为角色或物体外貌提供锚点,以在多次生成间保持一致引导生成图像的构图、结构或空间排布为一次制作编码一套既定的视觉身份或美学语言
- 常用工具
- IP-adapterControlNetImage-to-image generationMidjourney style reference (--sref parameter)Morphic reference image features
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
参考图与文字提示是互补而非互相竞争的两种生成引导方式。文字提示擅长指定主体内容、动作、叙事语境以及可以用语言描述的概念。参考图则擅长传达难以用语言表述的视觉质感:特定的色彩搭配、质感、动作姿态、空间排布,以及人物或物体的外貌。最强的生成工作流会同时使用两者:文字提示提供内容与语境引导,参考图提供视觉质感与一致性锚定。两者单用都达不到两者合用所能实现的效果。
可以这样理解…
向 AI 生成模型提供一张参考图,就像在交给设计师一份创作简报的同时附上一块情绪板:文字用语言描述你想要什么,而图像则在视觉上展示你的意思,传达出文字描述再多也无法完全捕捉的色调、风格与美学敏感度上的微妙之处。
实用提示
请投入时间去甄选高质量、清晰、精挑细选的参考图,而不是随手用现成的图。一张能清楚呈现你想提取的特定质感的参考图,,用于角色一致性的干净、布光良好的角色肖像,用于风格引导的一张能代表配色的强力图像,,能比一张杂乱或含义模糊的参考图提供更好的条件引导。模型只能提取参考图中清晰呈现的内容,因此参考图的清晰度与具体性,直接决定了它所提供条件引导的精确度。
类型与变体
风格参考图引导生成结果的整体美学、配色与视觉性格,而不约束主体或构图。人物参考图为某个特定人物或角色的外貌提供锚点,以在多次生成之间保持一致。构图参考图引导生成结果的空间排布、取景与构图结构。姿态参考图(配合 ControlNet 姿态条件使用)为角色提供一个特定的身体姿势。色彩参考图引导生成结果的配色与影调关系,而不约束风格。情绪板参考图则提供一组图像,共同为一次制作定义整体的美学方向。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
参考图用于商业制作,在 AI 生成图像中维持品牌与产品的视觉一致性;用于以角色为核心的 AI 视频,在不同镜头与场景间保持角色外貌一致;用于美术指导工作流,把既定的视觉身份传达给生成模型;用于风格迁移应用,把某件艺术作品或照片的美学复刻到新内容中;用于时尚与产品可视化,准确还原特定服饰或产品的外观;以及用于任何需要超出文字提示所能稳定达到的视觉具体性的 AI 生成场景。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
参考图是提供给 AI 生成模型、用于引导生成结果某些方面的视觉输入:风格、人物外貌、构图、配色或其他视觉质感。它传达文字提示无法完全指定的视觉信息,为模型提供一个可直接提取并应用到生成中的视觉锚点。
IP-Adapter 会编码参考图的整体视觉特征(美学质感、色彩关系、视觉风格),并据此影响生成,而不要求参考与输出在空间上对齐。ControlNet 则从参考中提取特定的结构信息(姿态、边缘、深度),用以约束生成结果的空间排布,同时允许视觉层面的重新风格化。IP-Adapter 引导美学;ControlNet 引导结构。
原则上任何图像都可以充当参考,但参考的质量与清晰度会直接影响条件引导的质量与精度。清晰、明确、突出呈现你想提取质感的图像,,用于角色一致性的角色面部、用于风格引导的标志性配色、用于姿态条件的特定姿势,,会比杂乱、含糊或低质量的参考产出更好的条件引导效果。请选择能清晰、明确展示你希望模型捕捉内容的参考图。
人物参考图为模型提供了角色外貌的具体视觉规范(面部、比例、发型与显著特征),这是仅靠文字描述无法精确锚定的。通过 IP-Adapter 或平台特有的一致性功能,让每次生成都以同一张角色参考图为条件,模型产出的结果便会反映参考角色的外貌,而不是每次都为所描述的类型生成一个新的变体。
风格参考图引导生成结果的整体美学、配色、色调与视觉性格:它传达的是一种期望的观感,而非具体的主体内容。它告诉模型如何渲染场景,而非渲染什么。风格参考图尤其适合在一批生成作品之间建立一致的视觉身份,也适合传达那些难以用文字完全指定的美学方向。
情绪板是一组精挑细选的参考图,共同为一个项目或制作定义视觉方向、美学敏感度与色调性格。在 AI 生成中,情绪板里的图像充当风格参考,引导生成内容的整体视觉身份。有些平台支持同时使用多张参考图;另一些则要求选出最具代表性的单张参考。一块甄选得当的情绪板,能把复杂的美学愿景提炼为模型可以响应的具体视觉范例。
参考图条件与文字提示影响之间的平衡,取决于所用的技术路径及其强度设置。强参考条件(高 IP-Adapter 权重、强 ControlNet 引导)可以主导生成,而文字提示引导退居次要地位。较弱的条件则让文字提示发挥更大影响。实践中最有效的做法是把条件强度设到让参考与文字都能产生有意义贡献的程度:参考锚定视觉质感或结构,文字提示引导内容与语境。
在 AI 生成中把受版权保护的图像用作参考,其法律地位是一个正在快速演变、且确实存在不确定性的领域。提供参考图以条件化生成,在技术上不同于复制该图像,但生成结果可能会以某种在法律上可能被认为相关的方式反映出参考的风格或视觉性格,这取决于司法辖区与具体情形。当你对参考条件化生成结果的商业用途存疑时,请咨询相关法律意见,并考虑使用原创、自有或已获授权的图像作为参考。