Question 1

什么是图生图 AI 生成？

Accepted Answer

图生图是一种生成工作流程，其中一幅现有图像与文本提示一同作为输入，模型在保留源图像构图或结构某些方面的同时对其进行变换。它不同于文本生成图像，后者完全依据文字描述构建，没有视觉起点。

Question 2

图生图中的去噪强度是什么？

Accepted Answer

去噪强度控制模型对源图像变换的程度。在低值（接近 0）下，输出与源图像高度相似，仅有极小改动。在高值（接近 1）下，源图像仅提供粗略的结构建议，模型施加实质性的变换。最佳数值取决于原图构图应被保留还是被重新想象到何种程度。

Question 3

图生图与文本生成图像有何不同？

Accepted Answer

文本生成图像完全依据文字描述生成图像，从随机噪声开始，没有视觉起点。图生图使用一幅现有图像作为部分初始化：在已有视觉结构的基础上开始去噪过程：文本提示引导该结构如何被变换，而非从零描述完整构图。

Question 4

什么是 img2img？

Accepted Answer

img2img 是图生图的常用缩写，在 Stable Diffusion 社区和工具界面中广泛使用。这些术语可互换使用，指的是同一种生成方法，其中一幅现有图像与文本提示一同作为输入以引导变换。

Question 5

我能用图生图来改变一张照片的风格吗？

Accepted Answer

可以。在保留构图的同时为照片施加艺术风格，是图生图生成最常见的用途之一。通过设定适中的去噪强度并加入描述风格的提示词，模型可以变换照片的视觉处理，同时保留其主体、取景和空间关系。

Question 6

什么是 ControlNet，它与图生图有何关系？

Accepted Answer

ControlNet 是面向扩散模型的条件控制系统，它使用从源图像提取的结构信息（如边缘图、深度图或姿态骨架）作为精确条件，而非直接的像素初始化。它是一种更高级的基于图像的条件形式，使特定结构特质比标准 img2img 更可靠地得到保留，并被广泛用于角色姿态控制、建筑布局匹配，以及其他需要精确结构遵循的场景。

Question 7

图生图和局部重绘有什么区别？

Accepted Answer

图生图在源图像视觉结构的引导下，对整幅图像或其相当一部分施加变换。局部重绘仅对遮罩区域施加生成，未遮罩区域保持不变。对于校正或替换一幅在其他方面尚可接受图像的特定小区域，局部重绘更为精确；对于将整体风格变换施加于整个构图，图生图是更合适的方法。

Question 8

图生图需要哪些输入？

Accepted Answer

标准图生图需要源图像、描述所需输出的文本提示，以及一个去噪强度值。一些工作流程会增加额外的条件，如用于排除不需要元素的负面提示、用于可复现性的种子值，以及特定于模型的参数。使用 ControlNet 的更高级工作流程还需要指定从源图像中提取何种类型的结构条件。

图生图

图生图是什么？

执导场景、设计角色、完成整部影片

类型与变体

准备好在 Morphic 里做第一个场景了吗？

常见使用场景

执导场景、设计角色、完成整部影片

常见问题（FAQ）