ノイズ / ノイズレベル

ノイズ / ノイズレベルとは?

AI生成において、ノイズとは拡散モデルが出発点とし、段階的に整えて画像を作り出すランダムな砂嵐です。ノイズレベルは、image-to-image生成を行う際にモデルが入力画像からどれだけ逸脱するかを制御します。

ひと目で分かる

別名
デノイジング強度(Img2imgの文脈で)ノイズ強度ガウスノイズ(使われる特定のノイズタイプの技術用語)
用途
すべての拡散モデル生成の出発点(純粋なノイズ→画像)Image-to-image生成における変換の度合いの制御ランダム性、シード、生成出力の関係の理解
主なツール
Stable diffusionComfyUIAutomatic1111All diffusion-based generation platforms
関連用語
Diffusion modelDenoisingSamplingCFG scaleSeedImage-to-imageLatent space
How it works in simple terms
拡散モデルは、画像にランダムなノイズを加えるプロセスを逆転させる方法を学習することで学習される。生成時には、ランダムなノイズから始め、プロンプトを使ってノイズの除去をステップごとに導き、ノイズが段階的に解像されるにつれて構造化された画像を生み出す。
Where you encounter this
ノイズレベルは、image-to-image生成のワークフローでデノイジング強度またはimg2img強度のパラメータとして現れる。テキストプロンプトからの生成はすべてノイズから始まるが、開始ノイズは通常自動的に管理される。ノイズレベルのパラメータをユーザーが直接制御できるのは、主にimg2imgとインペインティングの文脈である。

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

他の概念との比較

他の概念との比較

Compared with related concepts

ノイズレベル(デノイジング強度)とCFGスケールは、拡散モデルが条件付け信号にどれほど強く従うかを制御する2つの主要なパラメータである。CFGスケールは、汎用的でプロンプトのない出力を生むのに対して、モデルがどれほど強くテキストプロンプトに従うかを制御する。img2imgのノイズレベルは、入力画像を保持するのに対して、モデルがどれほど強くプロンプトに従うかを制御する。CFGスケールが高いと、プロンプトにより積極的に一致する出力が生まれる。ノイズレベルが高いと、入力画像からより積極的に乖離する出力が生まれる。両パラメータとも条件付けの強さと生成の自由のバランスを形作るが、条件付けの階層の異なる地点で作用する。


たとえば…

image-to-image生成におけるノイズレベルは、既存の彫刻を作り直す前にどれだけ粘土を取り除くかを決める彫刻家のようなものだ。低いノイズレベルは、元の形に小さな洗練重視の変更を加えるようなもの。高いノイズレベルは、おおまかな全体の塊だけが残るほど粘土を取り除き、新しい意図に従ってほぼゼロから作り直すようなものだ。


プロのヒント

image-to-imageのワークフローでは、ノイズレベルを「強い」か「弱い」かの二択の変換設定として扱うのではなく、クリエイティブなパラメータとして使うとよい。0.4〜0.6のノイズレベルが、最も生産的なクリエイティブな範囲であることが多い。モデルがプロンプトに従って入力を意味のある形で再解釈できる十分な自由がありつつ、コンポジション、照明、空間関係が有用な土台として保たれる十分な構造的連続性もある。非常に高いノイズレベル(0.8以上)は、入力画像を主にコンポジションのおおまかな参照として使う場合に適している。非常に低いレベル(0.3未満)は、元の画像をほぼそのまま保ちながら軽いスタイル調整をする場合に適している。

種類とバリエーション

ガウスノイズは、標準的な拡散モデルのプロセスで使われる特定のランダムノイズタイプである。正規(釣鐘型)の統計分布に従う値だ。text-to-image生成では、開始ノイズは純粋なガウスノイズである。image-to-image生成では、制御された量のガウスノイズが、デノイジング前に符号化された入力画像と混合される。異なるノイズスケジュール(線形、コサイン、その他)は、デノイジングのタイムステップにわたってノイズがどう分配されるかを定義し、異なる生成特性を生む。フィルム粒子は視覚的に関連するが技術的には別個の画像ノイズの形態で、写真やシネマティックな画像に美的要素として持ち込まれ、拡散プロセスの機能的なノイズとは別のスタイル的要素として、AI生成プロンプトで要求できる。

Morphicで最初のシーンを作ってみませんか?

Morphicを試す

主な活用シーン

ノイズレベルの理解が最も直接的に関連するのはimage-to-image(img2img)生成のワークフローで、そこではデノイジング強度パラメータが入力画像の変換度合いを直接制御する。インペインティングにも関連し、マスク領域に追加されるノイズが、モデルがどれほど自由にそこを埋めるかを決める。text-to-image生成では、シード(出発点として使われる特定のランダムノイズパターン)が主要なノイズ関連のユーザーパラメータで、生成の再現性を制御する。高度なワークフローでは、特定のスタイル的またはコンポジション的効果を得るために、カスタムノイズ注入やノイズスケジュールの操作が使われる。

創ってみませんか?

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。

FAQ

AI画像生成におけるノイズとは何ですか?

AI画像生成において、ノイズとは、拡散モデルが生成の出発点として使うランダムな統計的変動(テレビの砂嵐に似たもの)を指します。モデルは、テキストプロンプトやその他の条件付け信号に導かれて、ランダムな開始テンソルからノイズを段階的に取り除き、首尾一貫した画像が現れるよう学習されます。テキストプロンプトからの生成はすべて純粋なノイズから始まり、構造化された画像で終わります。

ノイズレベルまたはデノイジング強度とは何ですか?

ノイズレベル(image-to-imageの文脈ではしばしばデノイジング強度と呼ばれる)は、デノイジングの生成プロセスが始まる前に、入力画像にどれだけのノイズが追加されるかを制御するパラメータです。ノイズレベルが高いほど多くのノイズが追加され、モデルが元の画像から逸脱する自由が大きくなります。ノイズレベルが低いほど追加されるノイズは少なく、出力は入力により近く保たれます。img2img生成のワークフローで変換の度合いを制御する主要なパラメータです。

なぜシードを変えると出力が変わるのですか?

シードは、生成の出発点として使われる特定のランダムノイズパターンを決定する数値です。拡散モデルはノイズから始まり、モデルのデノイジングの経路は出発点となる特定のノイズに依存するため、異なるシードは異なるノイズパターンを生み、それがデノイジングプロセスを異なる経路に導き、同一のプロンプトと設定でも異なる出力を生みます。これが、同じプロンプトでも使うシードによって大きく異なる画像が生まれる理由です。

ノイズは生成ステップとどう関係しますか?

生成ステップとは、モデルが実行するデノイジングの反復回数を指し、各ステップで開始画像から段階的にノイズを取り除いていきます。ステップが多いほど、より細かく漸進的なノイズ除去が可能になり、一般的により高品質でディテールに富んだ出力を生みますが、より多くの計算時間を要します。ステップが少ないほど高速な結果が得られますが、細かいディテールを欠くことがあります。ノイズレベルは各ステップで減少します。最初のステップで最大のノイズ、最終ステップでほぼゼロのノイズになります。

image-to-image生成にはどのデノイジング強度を使うべきですか?

入力のおおまかなコンポジションと空間構造を保ちながら意味のあるクリエイティブな変換をするには、0.4〜0.65の範囲が最も生産的なことが多いです。0.3未満では軽いスタイル変更のみで、繊細な調整に有用です。0.75を超えると入力から強く乖離し、主にコンポジションのおおまかな参照として扱われます。理想的な値は、出力に入力をどれだけ反映させたいか、プロンプトをどれだけ反映させたいかによります。特定のモデルがどう反応するかを理解するため、この範囲で試してみる価値があります。

フィルム粒子は生成ノイズと同じものですか?

違います。フィルム粒子は視覚的な美的要素です。写真フィルムのハロゲン化銀の結晶から生じる、または美的効果のためデジタル撮像で合成的に持ち込まれる、目に見えるテクスチャのパターンです。拡散モデルの生成ノイズは、デノイジングの生成プロセスの出発素材として使われる数学的構成物(ガウスのランダム値)です。両者は、ともに画像の値のランダムな変動を伴うという点で概念的には関連していますが、フィルム粒子は目に見える美的選択であり、生成ノイズは生成プロセス中に解像されて消える内部的な技術機構です。

拡散モデルにおけるノイズスケジュールとは何ですか?

ノイズスケジュールは、生成プロセスのデノイジングステップにわたってノイズがどう分配され減らされるか、つまり最初の最大ノイズから最後の最小ノイズまで、各ステップでどれだけのノイズが取り除かれるかを定義します。異なるノイズスケジュール(線形、コサイン、指数)は、ステップ間のデノイジング作業の異なる分配を生み、生成品質と出力の性質に影響します。ノイズスケジュールは通常、生成に選択されたサンプラーアルゴリズムによって管理され、消費者向けインターフェースではユーザーが直接制御できないのが普通です。

クリエイティブな効果のためにノイズを意図的に使えますか?

はい、いくつかの方法で。img2imgのワークフローでは、ノイズレベルは直接的なクリエイティブパラメータです。これを変えると、入力の近い洗練から根本的な再解釈まで幅のある出力が生まれます。異なるシード値は、単一のプロンプトからクリエイティブなバリエーションを生み、複数のシードを生成して最も面白い出力を選ぶことで体系的に活用できます。一部の高度なワークフローは、特定のスタイル効果を得るためにカスタムノイズパターンを注入したり、特殊なノイズタイプを使ったりします。美的要素としてのフィルム粒子も、出力の独立した視覚的性質としてプロンプトで要求できます。

Can't find what you are looking for?
Contact us and let us know.
bg