DALL-E 2

DALL-E 2是什么?

DALL-E 2 是 OpenAI 的第二代 AI 图像模型,产出比其前身更锐利、分辨率更高的图像,并增加了对现有图像进行编辑、扩展和创建变体的能力。

一图看懂

Type of model
具有内补绘制和外补绘制能力的文本到图像扩散模型
Developed by
OpenAI
Key capability
以提升的质量从文本提示词生成 1024x1024 图像,外加内补绘制、外补绘制和图像变体生成
How it fits in AI workflow
用于创意和生产工作流程中的文本到图像生成、图像编辑、内容扩展和变体探索;在大多数当前专业应用中已由 DALL-E 3 接替

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

DALL-E 2 与 Stable Diffusion 1.


实用提示

即便更新的生成模型在原始图像质量上超越了 DALL-E 2,其内补绘制和外补绘制能力对特定编辑任务仍然有用。当你需要扩展一张现有图像,或用与周围风格相匹配的 AI 生成内容替换某个特定区域时,这些编辑模式可能比在仅供生成的工作流程中单靠提示工程尝试同一任务更可控。

类型与变体

文本到图像生成从书面提示词产出全新图像。内补绘制选择现有图像的一个遮罩区域,并基于文本描述生成新内容来填充它。外补绘制将图像扩展到其原始边界之外,生成与周围风格和语境相匹配的流畅新内容。图像变体在不使用文本提示词的情况下,以原图风格生成上传图像的替代版本。每种模式都使用相同的底层模型,但具有不同的调节输入和生成目标。

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

为设计项目、营销活动和内容制作工作流程生成概念图。使用内补绘制从照片中移除不需要的元素,或用 AI 生成的替代物替换它们。使用外补绘制将插图或照片扩展到其原始边界之外,以创建更宽的构图。生成现有图像风格一致的变体,用于 A/B 测试或创意探索。通过 OpenAI 的 API 与开发工作流程集成,将图像生成能力嵌入自定义应用。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

什么是 DALL-E 2?

DALL-E 2 是 OpenAI 的第二代文本到图像模型,于 2022 年 4 月发布。它使用基于扩散的架构产出比最初 DALL-E 分辨率更高的图像,并增加了内补绘制、外补绘制和图像变体能力。

DALL-E 2 与最初的 DALL-E 有何不同?

DALL-E 2 从 Transformer 自回归架构切换到扩散模型,以更高分辨率产出更锐利的图像。它还增加了图像编辑能力,包括最初版本未提供的内补绘制和外补绘制。

DALL-E 2 中的内补绘制是什么?

内补绘制允许用户选择现有图像内的一个区域,然后用文本描述应替换该区域的内容。模型生成新内容来填充所选区域,同时匹配图像周围的风格和语境。

DALL-E 2 中的外补绘制是什么?

外补绘制将现有图像扩展到其原始画布边界之外,生成将原图的风格、光照和视觉语境延续到扩展区域的新内容。

DALL-E 2 生成什么分辨率?

DALL-E 2 以 1024x1024 像素作为其最高分辨率生成图像,相较产出较低分辨率输出的最初 DALL-E 有大幅提升。

DALL-E 2 如今仍在使用吗?

DALL-E 2 在大多数生成任务中已大体被 DALL-E 3 接替,因为 DALL-E 3 提供显著更好的提示词遵循度和图像质量。不过,DALL-E 2 的内补绘制和外补绘制能力仍可被用于特定的编辑工作流程。

DALL-E 2 如何处理提示词理解?

DALL-E 2 使用基于 CLIP 的文本-图像对齐系统,将语言理解与视觉内容生成相连。它能处理范围广泛的提示词类型,但提示词遵循度不如 DALL-E 3 精确,尤其是对复杂的构图指令而言。

DALL-E 2 包含哪些安全功能?

DALL-E 2 包含内容过滤器,防止生成有害、露骨或侵权内容。它在某些语境中限制生成真实人物的面孔,并应用旨在防止滥用的过滤器,这些保护措施在 API 层面强制执行。

Can't find what you are looking for?
Contact us and let us know.
bg