Glossaryarrow
拡散モデル
拡散モデル

Diffusion Models(拡散モデル)は、段階的なノイズ付加プロセスを逆向きに学習することで画像や動画を生成する生成AIモデルのクラスです。純粋なランダムノイズから始め、学習したノイズ除去ステップを反復的に適用して、訓練データとテキストプロンプトなどの条件入力を満たす一貫した画像が現れるまで精緻化します。

プロセスは二段階で学習されます。第一に、順方向の拡散プロセスで訓練画像に段階的にノイズを加え、ランダムなノイズと区別がつかなくなるまでにします。第二に、ニューラルネットワークがこのプロセスを逆向きに行う方法を学習し、各ステップでノイズを除去して元の画像構造を復元する予測を行います。生成時には、モデルはランダムノイズから始め、テキストプロンプトやその他の条件信号に導かれてこの学習済みノイズ除去を適用し、ノイズを意味のある画像へと徐々に形作ります。このアプローチは多様で高品質な出力の生成に非常に有効で、Stable Diffusion、DALL-E 2、Imagenなど多くの現代の画像生成システムの基盤となっています。

拡散モデルは、GANsのような従来のアプローチと比べて、生成AIの仕組みにおける根本的な転換を示しています。高精細で多様な出力を出しつつ比較的安定して訓練できるため、現代のAI画像・動画生成では支配的なアーキテクチャであり、その仕組みを理解することで、生成結果を導き制御する直感がクリエイターに養われます。

Can't find what you are looking for?
Contact us and let us know.
bg