Glossaryarrow
ノイズ / ノイズレベル
ノイズ / ノイズレベル

AI画像・映像生成、特に拡散モデルの文脈において、ノイズとは画像データに追加されるか、その中に存在するランダムな統計的変動を指す。数学的には、調整されていないアナログテレビの視覚的な砂嵐や、露光不足のフィルムの粒子に似ている。拡散モデルにおいて、ノイズは生成プロセスにおいて特定の中心的役割を果たす。モデルはノイズ付加プロセスを逆転させるよう学習され、ノイズの多い画像から段階的にノイズを除去し、最終的にクリーンで認識可能な画像が現れるまでの過程を学ぶ。生成は純粋なノイズ(ターゲット画像と同じ次元のランダム値のテンソル)から始まり、モデルはテキストプロンプトやその他の条件付け信号に導かれて一連のステップにわたってこのノイズの成分を反復的に予測・除去し、完全なランダム性から構造化された首尾一貫した画像を生み出す。このデノイジング・プロセスにおける任意の時点でのノイズレベルは、どれだけのノイズが残っているかを表し、初期ステップは最大のノイズ、最終ステップは完全に解像された画像となる。

ノイズレベルはいくつかの文脈においてユーザーが制御可能なパラメータとなる。純粋なノイズではなく開始画像から生成する場合(image-to-image生成)、ノイズレベル(しばしばデノイジング強度またはimg2img強度と呼ばれる)は、デノイジング・プロセスが始まる前に入力画像に追加されるノイズの量を制御する。ノイズレベルが高いほどより多くのノイズが追加され、モデルが再構築において元の画像から逸脱する自由が大きくなる。これは本質的に入力のより強い変換である。ノイズレベルが低いほど追加されるノイズは少なく、モデルの出力は元の画像により近く保たれる。これはより保守的な変換である。このパラメータはimage-to-imageワークフローの基本である。入力画像の構造を保持することと、モデルがプロンプトに従ってそれを再解釈することを許容することのバランスを決定する。非常に低いノイズレベルでは、出力は入力のコンポジションと構造を密接に反映する。非常に高いノイズレベルでは、出力は入力をゆるい参照としてのみ使用し、プロンプトの誘導が優先される。

ノイズレベルは生成プロセスのステップ数とも相互作用する。デノイジング・ステップが多いほど、モデルはノイズを除去する際により細かく漸進的な調整を行えるようになり、一般的により高品質でディテールに富んだ出力を生み出す。しかし、計算時間の増加という代償を伴う。ステップが少ないほど、より高速な結果が得られるが、細かいディテールが欠けたり、より粗いデノイジング解像度から目に見えるアーティファクトを示したりすることがある。ノイズスケジュール(モデルがデノイジング・ステップを通じて高ノイズから低ノイズへどれだけ急速にまたは段階的に移行するか)は、生成品質とスタイルに影響する別のパラメータであり、生成のために選択されたサンプラー・アルゴリズムによって管理される。この文脈におけるノイズとノイズレベルを理解することは、ユーザーが特定の生成挙動が発生する理由(高強度におけるimage-to-image変換が入力から劇的に逸脱する理由、より多くのステップが細かいディテールを改善する傾向がある理由、同じプロンプトでもランダムな開始ノイズ(シード)に応じて意味のある異なる結果を生み出せる理由)を理解する助けとなる。

Can't find what you are looking for?
Contact us and let us know.
bg