DALL-E 3

DALL-E 3是什么?

DALL-E 3 是 OpenAI 最先进的图像模型,产出紧密匹配详细书面提示词的图像,并在处理图像内文本上远比其前身准确。

一图看懂

Type of model
具有高提示词遵循度和文本渲染的先进文本到图像扩散模型
Developed by
OpenAI
Key capability
生成紧密遵循复杂、多元素提示词的图像,相较先前的 DALL-E 模型在文本渲染和构图准确性上有显著提升
How it fits in AI workflow
用于提示词遵循度至关重要的专业图像生成、需要可读文本的设计样稿,以及与 ChatGPT 或 Microsoft 工具集成的创意工作流程

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

DALL-E 3 与 Midjourney 对比:DALL-E 3 优先考虑提示词遵循度、文本渲染准确性,以及与包括 ChatGPT 在内的 OpenAI 产品生态的集成。Midjourney 优先考虑审美质量和风格一致性,常产出带有独特视觉特征的图像,用户在艺术和设计工作中觉得颇具吸引力。DALL-E 3 倾向于更精确地遵循详细指令;Midjourney 常以更多的创意余地和审美判断来解读提示词。


实用提示

通过 ChatGPT 使用的 DALL-E 3 支持在对话中迭代精修,这是其最未被充分利用的优势之一。与其精心制作一个完美的单次提示词,不如描述你最初的概念,审视输出,然后用平实的语言请求具体调整。这种对话式方式往往比一开始就尝试写出一个全面提示词产出更好的结果,因为你可以在不重写整个描述的情况下修正具体元素。

类型与变体

通过 ChatGPT 访问的 DALL-E 3 允许对话式的提示词精修和迭代。通过 OpenAI API 访问的 DALL-E 3 支持以编程方式集成到自定义应用和工作流程中。Microsoft Designer 和 Image Creator 中的该模型提供一个面向消费者的界面,围绕生成能力构建了额外的模板和品牌设计工具。所有版本都使用相同的底层模型,区别在于界面层面如何构建和精修提示词。

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

专业图像生成,其中输出必须紧密匹配带有多个必需元素的特定创意简报。需要在生成图像内嵌入清晰可读文本的设计样稿。通过 ChatGPT 中的对话式提示词精修进行迭代式概念探索。与 Microsoft 创意工具集成的营销和内容制作工作流程。将高质量图像生成嵌入产品或服务界面的基于 API 的自定义应用。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

什么是 DALL-E 3?

DALL-E 3 是 OpenAI 的第三代文本到图像模型,于 2023 年 10 月发布。相较 DALL-E 2,它在提示词遵循度、构图准确性和文本渲染上有显著提升,并集成到 ChatGPT 中以进行对话式提示词精修。

DALL-E 3 比 DALL-E 2 好在哪里?

DALL-E 3 处理复杂多元素提示词的准确性远高于 DALL-E 2,更忠实地呈现指定的物体、空间关系和风格要求。它还大幅改进了图像内的文本渲染,这是早期模型曾经吃力的领域。

我在哪里能访问 DALL-E 3?

DALL-E 3 可通过 ChatGPT、OpenAI 的 API,以及包括 Designer 和 Image Creator 在内的 Microsoft 工具访问。ChatGPT Plus 订阅者可通过对话生成图像,而 API 访问支持以编程方式集成到自定义应用中。

DALL-E 3 能在图像中放置可读文本吗?

可以。DALL-E 3 相较先前模型在文本渲染上有显著改进,能在图像内为设计样稿和图形产出清晰可读的文本。虽然并非对所有文本放置都完全可靠,但它的表现明显优于 DALL-E 2 和许多同期替代方案。

通过 ChatGPT 使用 DALL-E 3 如何运作?

在 ChatGPT 中,用户用平实的语言描述所需内容,并收到作为回应生成的图像。随后他们可通过后续消息请求具体改动,从而通过自然对话精修提示词,而非从零重写一个技术性提示词。

DALL-E 3 有哪些内容限制?

DALL-E 3 包含模型层面的限制,针对生成真实公众人物的逼真描绘、受版权保护的角色,以及某些类别的有害或露骨内容。这些限制在生成时施加,而非仅通过事后过滤。

DALL-E 3 适合专业创意工作吗?

适合。DALL-E 3 改进的提示词遵循度使其在输出需要匹配特定创意简报的专业工作流程中具有实用性。它的文本渲染能力也使其在设计样稿和需要在图像内嵌入可读文本的内容上很有用。

DALL-E 3 与开源替代方案相比如何?

DALL-E 3 通过 OpenAI 的产品和 API 提供高质量和易用性,但它是专有的,使用受 OpenAI 政策管辖。像 Stable Diffusion 这样的开源替代方案提供更多灵活性、本地部署和社区自定义,但需要更多技术配置,且开箱即用的提示词遵循度不及 DALL-E 3。

Can't find what you are looking for?
Contact us and let us know.
bg