Stable Diffusion
Stable Diffusionは、Stability AIが学術研究グループと共同で開発したオープンソースのAI画像生成モデルで、2022年に初めてリリースされました。高品質なテキストto画像モデルとして、オープンウェイトで公開された最初期の一つであり、誰でもダウンロード・実行・改変できるため、コミュニティによる開発・ファインチューン版・派生ツールの大規模なエコシステムが生まれました。
モデルは潜在拡散アーキテクチャを用い、ピクセルではなく圧縮された潜在空間でノイズ除去を行うため、従来の拡散アプローチより計算効率が高く、大規模クラウドではなく一般のハードウェアでも生成できます。このアクセスしやすさとオープンソース性により、ベースモデルの上に作られたコミュニティ製のファインチューン・LoRA・拡張・インターフェースが爆発的に増えました。Automatic1111、ComfyUIなど多くのプラットフォームがStable Diffusionをローカルで動かすUIとして登場し、モデルはオープンソースAI画像生成エコシステムの大部分の基盤になりました。初代以降も複数のメジャーバージョンがリリースされ、品質・プロンプト遵守・能力がそれぞれ向上しています。
Stable Diffusionのオープンソースリリースは、AI画像生成の民主化の転換点となり、高品質な生成モデルが大企業のインフラ外でも動かせること、そして開発者・アーティスト・研究者のグローバルなコミュニティが技術を拡張・研究・発展させられることを示しました。多くの商用AI生成ツールがStable Diffusionのアーキテクチャとオープンな開発モデルに基づくか、直接の影響を受けています。