Question 1

什么是 DALL-E 2？

Accepted Answer

DALL-E 2 是 OpenAI 的第二代文本到图像模型，于 2022 年 4 月发布。它使用基于扩散的架构产出比最初 DALL-E 分辨率更高的图像，并增加了内补绘制、外补绘制和图像变体能力。

Question 2

DALL-E 2 与最初的 DALL-E 有何不同？

Accepted Answer

DALL-E 2 从 Transformer 自回归架构切换到扩散模型，以更高分辨率产出更锐利的图像。它还增加了图像编辑能力，包括最初版本未提供的内补绘制和外补绘制。

Question 3

DALL-E 2 中的内补绘制是什么？

Accepted Answer

内补绘制允许用户选择现有图像内的一个区域，然后用文本描述应替换该区域的内容。模型生成新内容来填充所选区域，同时匹配图像周围的风格和语境。

Question 4

DALL-E 2 中的外补绘制是什么？

Accepted Answer

外补绘制将现有图像扩展到其原始画布边界之外，生成将原图的风格、光照和视觉语境延续到扩展区域的新内容。

Question 5

DALL-E 2 生成什么分辨率？

Accepted Answer

DALL-E 2 以 1024x1024 像素作为其最高分辨率生成图像，相较产出较低分辨率输出的最初 DALL-E 有大幅提升。

Question 6

DALL-E 2 如今仍在使用吗？

Accepted Answer

DALL-E 2 在大多数生成任务中已大体被 DALL-E 3 接替，因为 DALL-E 3 提供显著更好的提示词遵循度和图像质量。不过，DALL-E 2 的内补绘制和外补绘制能力仍可被用于特定的编辑工作流程。

Question 7

DALL-E 2 如何处理提示词理解？

Accepted Answer

DALL-E 2 使用基于 CLIP 的文本-图像对齐系统，将语言理解与视觉内容生成相连。它能处理范围广泛的提示词类型，但提示词遵循度不如 DALL-E 3 精确，尤其是对复杂的构图指令而言。

Question 8

DALL-E 2 包含哪些安全功能？

Accepted Answer

DALL-E 2 包含内容过滤器，防止生成有害、露骨或侵权内容。它在某些语境中限制生成真实人物的面孔，并应用旨在防止滥用的过滤器，这些保护措施在 API 层面强制执行。

DALL-E 2

DALL-E 2是什么？