Question 1

什么是 DALL-E 3？

Accepted Answer

DALL-E 3 是 OpenAI 的第三代文本到图像模型，于 2023 年 10 月发布。相较 DALL-E 2，它在提示词遵循度、构图准确性和文本渲染上有显著提升，并集成到 ChatGPT 中以进行对话式提示词精修。

Question 2

DALL-E 3 比 DALL-E 2 好在哪里？

Accepted Answer

DALL-E 3 处理复杂多元素提示词的准确性远高于 DALL-E 2，更忠实地呈现指定的物体、空间关系和风格要求。它还大幅改进了图像内的文本渲染，这是早期模型曾经吃力的领域。

Question 3

我在哪里能访问 DALL-E 3？

Accepted Answer

DALL-E 3 可通过 ChatGPT、OpenAI 的 API，以及包括 Designer 和 Image Creator 在内的 Microsoft 工具访问。ChatGPT Plus 订阅者可通过对话生成图像，而 API 访问支持以编程方式集成到自定义应用中。

Question 4

DALL-E 3 能在图像中放置可读文本吗？

Accepted Answer

可以。DALL-E 3 相较先前模型在文本渲染上有显著改进，能在图像内为设计样稿和图形产出清晰可读的文本。虽然并非对所有文本放置都完全可靠，但它的表现明显优于 DALL-E 2 和许多同期替代方案。

Question 5

通过 ChatGPT 使用 DALL-E 3 如何运作？

Accepted Answer

在 ChatGPT 中，用户用平实的语言描述所需内容，并收到作为回应生成的图像。随后他们可通过后续消息请求具体改动，从而通过自然对话精修提示词，而非从零重写一个技术性提示词。

Question 6

DALL-E 3 有哪些内容限制？

Accepted Answer

DALL-E 3 包含模型层面的限制，针对生成真实公众人物的逼真描绘、受版权保护的角色，以及某些类别的有害或露骨内容。这些限制在生成时施加，而非仅通过事后过滤。

Question 7

DALL-E 3 适合专业创意工作吗？

Accepted Answer

适合。DALL-E 3 改进的提示词遵循度使其在输出需要匹配特定创意简报的专业工作流程中具有实用性。它的文本渲染能力也使其在设计样稿和需要在图像内嵌入可读文本的内容上很有用。

Question 8

DALL-E 3 与开源替代方案相比如何？

Accepted Answer

DALL-E 3 通过 OpenAI 的产品和 API 提供高质量和易用性，但它是专有的，使用受 OpenAI 政策管辖。像 Stable Diffusion 这样的开源替代方案提供更多灵活性、本地部署和社区自定义，但需要更多技术配置，且开箱即用的提示词遵循度不及 DALL-E 3。

DALL-E 3

DALL-E 3是什么？