Question 1

什么是文生图 AI 生成?

Accepted Answer

文生图 AI 生成是由一段书面文字提示创作图像的过程。用户描述想要看到的内容(主体、构图、风格与氛围),AI 模型便合成一张与描述相符的视觉结果。它是最易上手、被最广泛使用的 AI 图像生成形式。

Question 2

文生图在技术上是如何运作的?

Accepted Answer

大多数文生图系统采用扩散模型。文本提示先由文本编码器编码为一种数学表示,这一表示再被用于引导一个去噪过程:它从随机噪声出发,逐步把噪声塑形为一张流畅图像。提示条件把去噪导向与所描述内容、风格与构图相符的画面。该过程历经多个迭代步骤,每一步都让图像进一步精修。

Question 3

什么样的文生图提示算是好提示?

Accepted Answer

有效的文生图提示是具体的、按层级组织的,且视觉上具象。它们以清晰的视觉属性描述主体,指明取景与镜头角度等构图信息,界定场景与环境,限定灯光,并指明艺术媒介或风格。含糊或抽象的语言会产出不可预测的结果;精确的视觉描述则产出更稳定、更准确的结果。对提示进行测试与迭代,是这一工作流中正常且必要的环节。

Question 4

文生图中的 guidance scale 是什么?

Accepted Answer

guidance scale 是一个参数,用于控制生成图像对文字提示的贴合程度。较高的 guidance scale 数值会让模型更看重提示,产出更严格遵循提示描述的结果,但画面可能过饱和、显得人工锐利。较低的数值则给模型更多创作自由,产出看起来更自然的结果,但可能在细枝末节上偏离提示。为给定的模型与用例找到合适的 guidance scale,是一项重要的校准工作。

Question 5

文生图中的 seed(种子)是什么?

Accepted Answer

种子是一个数字,用于初始化生成过程所由之出发的随机噪声。用相同的种子配合相同的提示与设置,会产出相同的图像;而改变种子则产出不同的变体。种子对可复现性很有用:只改一个元素就能生成一致的变体;也便于在找到你喜欢的构图或版式后,保持种子不变、只改提示来迭代。

Question 6

文生图与图像编辑有什么不同?

Accepted Answer

文生图从零开始、依据一段书面描述创作一张新图像;它并不修改已有图像。图像编辑工具则作用于已有的照片或图像,在不依据文字描述生成新内容的前提下调整其属性。诸如内补绘制(inpainting)与外延绘制(outpainting)等 AI 驱动的图像编辑工具,虽借助生成技术来填补或扩展图像,但它们作用于已有的视觉内容,而非纯粹由提示从头生成。

Question 7

文生图 AI 模型能生成特定的真实人物吗?

Accepted Answer

大多数商用文生图平台会限制或禁止按姓名生成特定的真实个体,尤其是公众人物。这是一项与同意、虚假信息风险及潜在滥用相关的安全与法律措施。模型在被提示时或许有能力生成相貌,但负责任的平台会施加过滤与政策来限制这一能力。对于涉及特定人物的商业制作,获得授权的摄影或经妥善同意的参考材料,仍是恰当的做法。

Question 8

什么决定了文生图结果的质量?

Accepted Answer

结果质量取决于模型训练数据的质量与覆盖广度、其文字理解的精细度、提示的具体性与结构,以及所用的推理参数(步数、guidance scale、分辨率)。在模型能力之外,提示质量是从业者可控范围内最大的变量:面对同一主体,同一个模型在一个含糊的提示与一个精确组织的提示下,产出的结果会天差地别。

文生图(Text-to-Image)

文生图(Text-to-Image)是什么？

执导场景、设计角色、完成整部影片

类型与变体

准备好在 Morphic 里做第一个场景了吗？

常见使用场景

执导场景、设计角色、完成整部影片

常见问题（FAQ）