FLUX
FLUX是什么?
FLUX 是一个强大的开源 AI 图像生成模型,能根据文本提示词产出高质量图像,尤其擅长遵循复杂指令并在图像内正确渲染文字。
一图看懂
- Type of model
- 基于 Transformer 的文本生成图像模型
- Developed by
- Black Forest Labs
- Key capability
- 高质量图像生成,提示词遵循度强、文字渲染准确、人体解剖结构可靠
- How it fits in AI workflow
- 供开发者与创作者用作图像生成、自定义微调以及构建 AI 驱动创意工具的基础模型,尤其适用于商业模型限制或成本构成制约因素的开源与自托管环境
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
FLUX 与 Stable Diffusion:两者都是有同一核心研究团队深度参与开发的开源图像生成模型。Stable Diffusion 采用 U-Net 架构,并确立了开源生成生态。FLUX 采用更新的 Transformer 架构,是作为一次刻意的架构进步而开发的,在提示词遵循度、图像内文字渲染与人体解剖准确性方面有显著改进。FLUX 在复杂提示词上通常产出更强的结果,而 Stable Diffusion 生态在更长的历史中积累了更庞大的现有微调模型库与 ControlNet 实现。
实用提示
FLUX 强大的提示词遵循度意味着,在提示词中做到具体而详尽,会产出比早期模型(它们常会自由地重新诠释含糊指令)明显更好的结果。与其依赖模型创造性地填补空缺,不如提供关于主体、光照、构图与风格的精确描述,往往能让 FLUX 回报以准确、细致的输出。当生成图像中需要出现文字时,FLUX 的处理远胜于大多数开源前作:在提示词中用引号指明确切的文字内容,通常能产出可辨识的结果。
类型与变体
- FLUX.
- 1 Pro 是质量最高的商业变体,针对输出保真度至关重要的专业制作用途进行优化。FLUX.
- 1 Dev 是面向开发者的变体,在开放授权下可用于实验、研究和构建自定义应用。FLUX.
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
开发者将 FLUX 作为构建 AI 驱动创意应用和工具的基础模型,利用其开放授权将其集成到产品中而不受商业限制。创作者将其用于需要强文字渲染的图像生成工作流,例如创建品牌影像、文字密集的构图或教学视觉素材。微调者使用 Dev 变体作为基础,训练自定义 LoRA 模型,使基础模型专门化为特定风格或主体。研究者使用 FLUX 探索新的提示词技术和生成方法,并将改进回馈给开源社群。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
FLUX 是 Black Forest Labs 开发的开源 AI 图像生成模型,于 2024 年发布,作为 Stable Diffusion 的下一代替代方案。它采用基于 Transformer 的架构,以强提示词遵循度、高图像质量、图像内文字渲染准确,以及可靠的人体解剖正确性而著称:这些都是早期开源模型存在明显局限的领域。
FLUX 由 Black Forest Labs 开发,该公司由数位曾在 Stability AI 主导 Stable Diffusion 开发的核心研究者创立。团队将其在开源扩散模型研究方面的经验带入 FLUX,将其构建于全新的基于 Transformer 的架构之上,而非 Stable Diffusion 所用的 U-Net 主干。
FLUX 以针对不同用例优化的模型家族形式发布。FLUX.1 Pro 是面向专业制作的最高质量商业变体。FLUX.1 Dev 开放供开发者实验和构建自定义应用。FLUX.1 Schnell 是速度优化变体,用于快速原型设计与迭代。FLUX 2 与 FLUX Kontext 是带来进一步能力提升的后续版本。
相比 Stable Diffusion 的 U-Net 主干,FLUX 采用更新的基于 Transformer 的架构,在含多元素的复杂提示词上通常产出更强结果,更好地处理图像内文字渲染,并保持更准确的人体解剖结构。Stable Diffusion 在更长的发布历史中积累了更庞大的现有微调模型与社群工具库。两者都是开源的,且都有相互重叠的研究团队参与开发。
图像内文字渲染是 FLUX 相较于早期开源模型最突出的改进之一。当提示词中清晰指明文字内容时(通常是在描述里把所需文字放在引号内),FLUX 能够在生成图像中产出可辨识、流畅的文字,而这一直是 Stable Diffusion 等模型的一大短板。
FLUX 的模型可用性取决于具体变体。FLUX.1 Dev 和 FLUX.1 Schnell 在授权许可下发布,可用于开发者实验和个人用途。FLUX.1 Pro 通过商业 API 提供。各变体的条款不尽相同,因此在构建商业产品或应用之前,建议查阅 Black Forest Labs 针对各模型的现行授权文档。
FLUX 的 Dev 变体支持微调,开源社群已开发出 LoRA 训练流程,使创作者和开发者能够在 FLUX 基础之上针对特定风格、角色或视觉领域训练自定义模型。微调后的 FLUX 模型在 Hugging Face 和 Civitai 等平台上被广泛分享,使可用的专门化生成能力库超越基础模型不断扩展。
在本地运行 FLUX 需要一块性能尚可、显存充足的 GPU:FLUX.1 Dev 和 Schnell 模型在标准分辨率下生成通常至少需要 8GB 显存,12GB 或以上能提供更宽裕的余量。Schnell 变体的速度优化使其在中端硬件上更具可行性。社群还开发了模型的量化版本,以一定的输出质量为代价降低内存需求。