Question 1

AI画像生成におけるFLUXとは何ですか？

Accepted Answer

FLUXはBlack Forest Labsが開発したオープンソースのAI画像生成モデルで、Stable Diffusionの次世代の代替として2024年にリリースされました。トランスフォーマーベースのアーキテクチャを使い、強力なプロンプト忠実度、高い画像品質、画像内の正確なテキストレンダリング、信頼できる解剖学的正確性で知られています。これらは以前のオープンソースモデルが大きな限界を抱えていた領域です。

Question 2

FLUXは誰が作りましたか？

Accepted Answer

FLUXはBlack Forest Labsによって開発されました。この会社は、以前Stability AIでStable Diffusionの開発の中心にいた何人かの主要研究者によって設立されました。チームはオープンソースの拡散モデル研究の経験をFLUXに持ち込み、Stable Diffusionで使われたU-Netバックボーンではなく、新しいトランスフォーマーベースのアーキテクチャの上にそれを構築しました。

Question 3

FLUXのさまざまなモデルバリアントは何ですか？

Accepted Answer

FLUXは異なるユースケースに最適化されたモデルファミリーとしてリリースされています。FLUX.1 Proはプロの制作向けの最高品質の商用バリアントです。FLUX.1 Devは開発者の実験とカスタムアプリケーションの構築のために開かれています。FLUX.1 Schnellは迅速なプロトタイピングと反復のために速度に最適化されています。FLUX 2とFLUX Kontextはさらなる能力改善を加えた後続のリリースです。

Question 4

FLUXはStable Diffusionとどう比較されますか？

Accepted Answer

FLUXはStable DiffusionのU-Netバックボーンと比べてより新しいトランスフォーマーベースのアーキテクチャを使い、複数の要素を持つ複雑なプロンプトで概してより強力な結果を生み出し、画像内のテキストレンダリングをよりよく扱い、より正確な人体解剖を維持します。Stable Diffusionは、より長いリリースの歴史の中で築かれた既存のファインチューニング済みモデルやコミュニティツールのより大きなライブラリを持ちます。どちらもオープンソースで、重なり合う研究チームの関与のもとで開発されています。

Question 5

FLUXは画像内にテキストを生成できますか？

Accepted Answer

生成画像内のテキストレンダリングは、以前のオープンソースモデルに対するFLUXの際立った改善の一つです。テキスト内容をプロンプト内で明確に指定すると（通常は記述内で望ましいテキストを引用符で囲むことで）、FLUXは生成画像内に読み取り可能で整合したテキストを生成できます。これはStable Diffusionのようなモデルの大きな弱点でした。

Question 6

FLUXは無料で使えますか？

Accepted Answer

FLUXのモデルの利用可能性は具体的なバリアントによります。FLUX.1 DevとFLUX.1 Schnellは、開発者の実験や個人利用にアクセス可能なライセンスのもとでリリースされています。FLUX.1 Proは商用APIを通じて利用できます。バリアント間で条件が異なるため、商用製品やアプリケーションを構築する前に、各モデルについてBlack Forest Labsの現行のライセンス文書を確認することをお勧めします。

Question 7

FLUXはファインチューニングできますか？

Accepted Answer

FLUXのDevバリアントはファインチューニングをサポートしており、オープンソースコミュニティは、クリエイターや開発者が特定のスタイル、キャラクター、視覚的ドメインのためにFLUXベースの上にカスタムモデルを学習できるLoRA学習パイプラインを開発しています。ファインチューニング済みのFLUXモデルはHugging FaceやCivitaiのようなプラットフォームで広く共有されており、ベースモデルを超えて利用可能な特化した生成機能のライブラリを拡張しています。

Question 8

FLUXをローカルで動かすにはどんなハードウェアが必要ですか？

Accepted Answer

FLUXをローカルで動かすには、十分なVRAMを備えたそれなりに高性能なGPUが必要です。FLUX.1 DevとSchnellのモデルは、標準解像度での生成に通常少なくとも8GBのVRAMを必要とし、12GB以上であればより余裕のある動作が可能です。Schnellバリアントの速度最適化により、中位のハードウェアでもより実用的になります。メモリ要件を削減するモデルの量子化版もコミュニティによって開発されていますが、出力品質はいくらか犠牲になります。

FLUX

FLUXとは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ