FLUX

FLUX是什么?

FLUX 是一个强大的开源 AI 图像生成模型,能根据文本提示词产出高质量图像,尤其擅长遵循复杂指令并在图像内正确渲染文字。

一图看懂

Type of model
基于 Transformer 的文本生成图像模型
Developed by
Black Forest Labs
Key capability
高质量图像生成,提示词遵循度强、文字渲染准确、人体解剖结构可靠
How it fits in AI workflow
供开发者与创作者用作图像生成、自定义微调以及构建 AI 驱动创意工具的基础模型,尤其适用于商业模型限制或成本构成制约因素的开源与自托管环境

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

FLUX 与 Stable Diffusion:两者都是有同一核心研究团队深度参与开发的开源图像生成模型。Stable Diffusion 采用 U-Net 架构,并确立了开源生成生态。FLUX 采用更新的 Transformer 架构,是作为一次刻意的架构进步而开发的,在提示词遵循度、图像内文字渲染与人体解剖准确性方面有显著改进。FLUX 在复杂提示词上通常产出更强的结果,而 Stable Diffusion 生态在更长的历史中积累了更庞大的现有微调模型库与 ControlNet 实现。


实用提示

FLUX 强大的提示词遵循度意味着,在提示词中做到具体而详尽,会产出比早期模型(它们常会自由地重新诠释含糊指令)明显更好的结果。与其依赖模型创造性地填补空缺,不如提供关于主体、光照、构图与风格的精确描述,往往能让 FLUX 回报以准确、细致的输出。当生成图像中需要出现文字时,FLUX 的处理远胜于大多数开源前作:在提示词中用引号指明确切的文字内容,通常能产出可辨识的结果。

类型与变体

  • FLUX.
  • 1 Pro 是质量最高的商业变体,针对输出保真度至关重要的专业制作用途进行优化。FLUX.
  • 1 Dev 是面向开发者的变体,在开放授权下可用于实验、研究和构建自定义应用。FLUX.

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

开发者将 FLUX 作为构建 AI 驱动创意应用和工具的基础模型,利用其开放授权将其集成到产品中而不受商业限制。创作者将其用于需要强文字渲染的图像生成工作流,例如创建品牌影像、文字密集的构图或教学视觉素材。微调者使用 Dev 变体作为基础,训练自定义 LoRA 模型,使基础模型专门化为特定风格或主体。研究者使用 FLUX 探索新的提示词技术和生成方法,并将改进回馈给开源社群。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

AI 图像生成中的 FLUX 是什么?

FLUX 是 Black Forest Labs 开发的开源 AI 图像生成模型,于 2024 年发布,作为 Stable Diffusion 的下一代替代方案。它采用基于 Transformer 的架构,以强提示词遵循度、高图像质量、图像内文字渲染准确,以及可靠的人体解剖正确性而著称:这些都是早期开源模型存在明显局限的领域。

FLUX 是谁开发的?

FLUX 由 Black Forest Labs 开发,该公司由数位曾在 Stability AI 主导 Stable Diffusion 开发的核心研究者创立。团队将其在开源扩散模型研究方面的经验带入 FLUX,将其构建于全新的基于 Transformer 的架构之上,而非 Stable Diffusion 所用的 U-Net 主干。

FLUX 有哪些不同变体?

FLUX 以针对不同用例优化的模型家族形式发布。FLUX.1 Pro 是面向专业制作的最高质量商业变体。FLUX.1 Dev 开放供开发者实验和构建自定义应用。FLUX.1 Schnell 是速度优化变体,用于快速原型设计与迭代。FLUX 2 与 FLUX Kontext 是带来进一步能力提升的后续版本。

FLUX 与 Stable Diffusion 相比如何?

相比 Stable Diffusion 的 U-Net 主干,FLUX 采用更新的基于 Transformer 的架构,在含多元素的复杂提示词上通常产出更强结果,更好地处理图像内文字渲染,并保持更准确的人体解剖结构。Stable Diffusion 在更长的发布历史中积累了更庞大的现有微调模型与社群工具库。两者都是开源的,且都有相互重叠的研究团队参与开发。

FLUX 能在图像内生成文字吗?

图像内文字渲染是 FLUX 相较于早期开源模型最突出的改进之一。当提示词中清晰指明文字内容时(通常是在描述里把所需文字放在引号内),FLUX 能够在生成图像中产出可辨识、流畅的文字,而这一直是 Stable Diffusion 等模型的一大短板。

FLUX 可以免费使用吗?

FLUX 的模型可用性取决于具体变体。FLUX.1 Dev 和 FLUX.1 Schnell 在授权许可下发布,可用于开发者实验和个人用途。FLUX.1 Pro 通过商业 API 提供。各变体的条款不尽相同,因此在构建商业产品或应用之前,建议查阅 Black Forest Labs 针对各模型的现行授权文档。

可以微调 FLUX 吗?

FLUX 的 Dev 变体支持微调,开源社群已开发出 LoRA 训练流程,使创作者和开发者能够在 FLUX 基础之上针对特定风格、角色或视觉领域训练自定义模型。微调后的 FLUX 模型在 Hugging Face 和 Civitai 等平台上被广泛分享,使可用的专门化生成能力库超越基础模型不断扩展。

在本地运行 FLUX 需要什么硬件?

在本地运行 FLUX 需要一块性能尚可、显存充足的 GPU:FLUX.1 Dev 和 Schnell 模型在标准分辨率下生成通常至少需要 8GB 显存,12GB 或以上能提供更宽裕的余量。Schnell 变体的速度优化使其在中端硬件上更具可行性。社群还开发了模型的量化版本,以一定的输出质量为代价降低内存需求。

Can't find what you are looking for?
Contact us and let us know.
bg