FLUX

FLUXとは?

FLUXは強力なオープンソースのAI画像生成モデルで、テキストプロンプトから高品質な画像を生成します。複雑な指示に従う能力と、画像内にテキストを正しくレンダリングする能力が特に高いのが特徴です。

ひと目で分かる

Type of model
トランスフォーマーベースのテキストから画像への生成モデル
Developed by
Black Forest Labs
Key capability
強力なプロンプト忠実度、正確なテキストレンダリング、信頼できる解剖学的正確性を備えた高品質な画像生成
How it fits in AI workflow
開発者やクリエイターが画像生成、カスタムファインチューニング、AIを活用したクリエイティブツールの構築の基盤モデルとして使い、特に商用モデルの制限やコストが制約となるオープンソースおよびセルフホスト環境で利用されます

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

他の概念との比較

他の概念との比較

Compared with related concepts

FLUXとStable Diffusionの違い。どちらも同じ中核研究チームの大きな関与のもとで開発されたオープンソースの画像生成モデルです。Stable DiffusionはU-Netアーキテクチャを使い、オープンソースの生成エコシステムを確立しました。FLUXはより新しいトランスフォーマーアーキテクチャを使い、意図的なアーキテクチャの進歩として開発され、プロンプトへの忠実度、画像内のテキストレンダリング、解剖学的精度に特に改善があります。FLUXは複雑なプロンプトで概してより強力な結果を生み出す一方、Stable Diffusionのエコシステムは、より長い歴史の中で築かれた既存のファインチューニング済みモデルやControlNet実装のより大きなライブラリを持ちます。


プロのヒント

FLUXの強力なプロンプト忠実度は、曖昧な指示を自由に再解釈しがちだった以前のモデルよりも、プロンプトで具体的かつ詳細にすることが格段に良い結果を生むことを意味します。モデルが創造的にギャップを埋めるのに頼るのではなく、被写体、照明、構図、スタイルの正確な記述を提供することで、FLUXは正確で詳細な出力で応える傾向があります。生成画像にテキストを表示する必要がある場合、FLUXはほとんどのオープンソースの先行モデルよりはるかにうまく扱います。プロンプト内で正確なテキスト内容を引用符で指定すると、通常は読み取り可能な結果が得られます。

種類とバリエーション

  • FLUX.
  • 1 Proは最高品質の商用バリアントで、出力の忠実度が最優先されるプロの制作用途に最適化されています。FLUX.
  • 1 Devは開発者向けのバリアントで、オープンライセンスのもとで実験、研究、カスタムアプリケーションの構築に利用できます。FLUX.

Morphicで最初のシーンを作ってみませんか?

Morphicを試す

主な活用シーン

開発者は、商用制限なしに製品へ統合できるオープンライセンスを活用して、AIを活用したクリエイティブアプリケーションやツールを構築する基盤モデルとしてFLUXを使います。クリエイターは、ブランド画像、テキストの多い構図、説明用ビジュアルの作成など、強力なテキストレンダリングを必要とする画像生成ワークフローにそれを使います。ファインチューニングを行う人々は、特定のスタイルや被写体に特化したカスタムLoRAモデルを学習する基盤としてDevバリアントを使います。研究者は、新しいプロンプト技術や生成アプローチを探求するためにFLUXを使い、改善をオープンソースコミュニティに還元します。

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

FAQ

AI画像生成におけるFLUXとは何ですか?

FLUXはBlack Forest Labsが開発したオープンソースのAI画像生成モデルで、Stable Diffusionの次世代の代替として2024年にリリースされました。トランスフォーマーベースのアーキテクチャを使い、強力なプロンプト忠実度、高い画像品質、画像内の正確なテキストレンダリング、信頼できる解剖学的正確性で知られています。これらは以前のオープンソースモデルが大きな限界を抱えていた領域です。

FLUXは誰が作りましたか?

FLUXはBlack Forest Labsによって開発されました。この会社は、以前Stability AIでStable Diffusionの開発の中心にいた何人かの主要研究者によって設立されました。チームはオープンソースの拡散モデル研究の経験をFLUXに持ち込み、Stable Diffusionで使われたU-Netバックボーンではなく、新しいトランスフォーマーベースのアーキテクチャの上にそれを構築しました。

FLUXのさまざまなモデルバリアントは何ですか?

FLUXは異なるユースケースに最適化されたモデルファミリーとしてリリースされています。FLUX.1 Proはプロの制作向けの最高品質の商用バリアントです。FLUX.1 Devは開発者の実験とカスタムアプリケーションの構築のために開かれています。FLUX.1 Schnellは迅速なプロトタイピングと反復のために速度に最適化されています。FLUX 2とFLUX Kontextはさらなる能力改善を加えた後続のリリースです。

FLUXはStable Diffusionとどう比較されますか?

FLUXはStable DiffusionのU-Netバックボーンと比べてより新しいトランスフォーマーベースのアーキテクチャを使い、複数の要素を持つ複雑なプロンプトで概してより強力な結果を生み出し、画像内のテキストレンダリングをよりよく扱い、より正確な人体解剖を維持します。Stable Diffusionは、より長いリリースの歴史の中で築かれた既存のファインチューニング済みモデルやコミュニティツールのより大きなライブラリを持ちます。どちらもオープンソースで、重なり合う研究チームの関与のもとで開発されています。

FLUXは画像内にテキストを生成できますか?

生成画像内のテキストレンダリングは、以前のオープンソースモデルに対するFLUXの際立った改善の一つです。テキスト内容をプロンプト内で明確に指定すると(通常は記述内で望ましいテキストを引用符で囲むことで)、FLUXは生成画像内に読み取り可能で整合したテキストを生成できます。これはStable Diffusionのようなモデルの大きな弱点でした。

FLUXは無料で使えますか?

FLUXのモデルの利用可能性は具体的なバリアントによります。FLUX.1 DevとFLUX.1 Schnellは、開発者の実験や個人利用にアクセス可能なライセンスのもとでリリースされています。FLUX.1 Proは商用APIを通じて利用できます。バリアント間で条件が異なるため、商用製品やアプリケーションを構築する前に、各モデルについてBlack Forest Labsの現行のライセンス文書を確認することをお勧めします。

FLUXはファインチューニングできますか?

FLUXのDevバリアントはファインチューニングをサポートしており、オープンソースコミュニティは、クリエイターや開発者が特定のスタイル、キャラクター、視覚的ドメインのためにFLUXベースの上にカスタムモデルを学習できるLoRA学習パイプラインを開発しています。ファインチューニング済みのFLUXモデルはHugging FaceやCivitaiのようなプラットフォームで広く共有されており、ベースモデルを超えて利用可能な特化した生成機能のライブラリを拡張しています。

FLUXをローカルで動かすにはどんなハードウェアが必要ですか?

FLUXをローカルで動かすには、十分なVRAMを備えたそれなりに高性能なGPUが必要です。FLUX.1 DevとSchnellのモデルは、標準解像度での生成に通常少なくとも8GBのVRAMを必要とし、12GB以上であればより余裕のある動作が可能です。Schnellバリアントの速度最適化により、中位のハードウェアでもより実用的になります。メモリ要件を削減するモデルの量子化版もコミュニティによって開発されていますが、出力品質はいくらか犠牲になります。

Can't find what you are looking for?
Contact us and let us know.
bg