ノイズ / ノイズレベル
ノイズ / ノイズレベルとは?
AI生成において、ノイズとは拡散モデルが出発点とし、段階的に整えて画像を作り出すランダムな砂嵐です。ノイズレベルは、image-to-image生成を行う際にモデルが入力画像からどれだけ逸脱するかを制御します。
ひと目で分かる
- 別名
- デノイジング強度(Img2imgの文脈で)ノイズ強度ガウスノイズ(使われる特定のノイズタイプの技術用語)
- 用途
- すべての拡散モデル生成の出発点(純粋なノイズ→画像)Image-to-image生成における変換の度合いの制御ランダム性、シード、生成出力の関係の理解
- 主なツール
- Stable diffusionComfyUIAutomatic1111All diffusion-based generation platforms
- 関連用語
- Diffusion modelDenoisingSamplingCFG scaleSeedImage-to-imageLatent space
- How it works in simple terms
- 拡散モデルは、画像にランダムなノイズを加えるプロセスを逆転させる方法を学習することで学習される。生成時には、ランダムなノイズから始め、プロンプトを使ってノイズの除去をステップごとに導き、ノイズが段階的に解像されるにつれて構造化された画像を生み出す。
- Where you encounter this
- ノイズレベルは、image-to-image生成のワークフローでデノイジング強度またはimg2img強度のパラメータとして現れる。テキストプロンプトからの生成はすべてノイズから始まるが、開始ノイズは通常自動的に管理される。ノイズレベルのパラメータをユーザーが直接制御できるのは、主にimg2imgとインペインティングの文脈である。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
ノイズレベル(デノイジング強度)とCFGスケールは、拡散モデルが条件付け信号にどれほど強く従うかを制御する2つの主要なパラメータである。CFGスケールは、汎用的でプロンプトのない出力を生むのに対して、モデルがどれほど強くテキストプロンプトに従うかを制御する。img2imgのノイズレベルは、入力画像を保持するのに対して、モデルがどれほど強くプロンプトに従うかを制御する。CFGスケールが高いと、プロンプトにより積極的に一致する出力が生まれる。ノイズレベルが高いと、入力画像からより積極的に乖離する出力が生まれる。両パラメータとも条件付けの強さと生成の自由のバランスを形作るが、条件付けの階層の異なる地点で作用する。
たとえば…
image-to-image生成におけるノイズレベルは、既存の彫刻を作り直す前にどれだけ粘土を取り除くかを決める彫刻家のようなものだ。低いノイズレベルは、元の形に小さな洗練重視の変更を加えるようなもの。高いノイズレベルは、おおまかな全体の塊だけが残るほど粘土を取り除き、新しい意図に従ってほぼゼロから作り直すようなものだ。
プロのヒント
image-to-imageのワークフローでは、ノイズレベルを「強い」か「弱い」かの二択の変換設定として扱うのではなく、クリエイティブなパラメータとして使うとよい。0.4〜0.6のノイズレベルが、最も生産的なクリエイティブな範囲であることが多い。モデルがプロンプトに従って入力を意味のある形で再解釈できる十分な自由がありつつ、コンポジション、照明、空間関係が有用な土台として保たれる十分な構造的連続性もある。非常に高いノイズレベル(0.8以上)は、入力画像を主にコンポジションのおおまかな参照として使う場合に適している。非常に低いレベル(0.3未満)は、元の画像をほぼそのまま保ちながら軽いスタイル調整をする場合に適している。
種類とバリエーション
ガウスノイズは、標準的な拡散モデルのプロセスで使われる特定のランダムノイズタイプである。正規(釣鐘型)の統計分布に従う値だ。text-to-image生成では、開始ノイズは純粋なガウスノイズである。image-to-image生成では、制御された量のガウスノイズが、デノイジング前に符号化された入力画像と混合される。異なるノイズスケジュール(線形、コサイン、その他)は、デノイジングのタイムステップにわたってノイズがどう分配されるかを定義し、異なる生成特性を生む。フィルム粒子は視覚的に関連するが技術的には別個の画像ノイズの形態で、写真やシネマティックな画像に美的要素として持ち込まれ、拡散プロセスの機能的なノイズとは別のスタイル的要素として、AI生成プロンプトで要求できる。
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
ノイズレベルの理解が最も直接的に関連するのはimage-to-image(img2img)生成のワークフローで、そこではデノイジング強度パラメータが入力画像の変換度合いを直接制御する。インペインティングにも関連し、マスク領域に追加されるノイズが、モデルがどれほど自由にそこを埋めるかを決める。text-to-image生成では、シード(出発点として使われる特定のランダムノイズパターン)が主要なノイズ関連のユーザーパラメータで、生成の再現性を制御する。高度なワークフローでは、特定のスタイル的またはコンポジション的効果を得るために、カスタムノイズ注入やノイズスケジュールの操作が使われる。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。