ノイズ / デノイジング
ノイズ / デノイジングとは?
AI画像生成において、ノイズは純粋なランダムな砂嵐の開始画像であり、デノイジングはAIがその砂嵐を段階的に首尾一貫した画像へと変えていくプロセスです。ポストプロダクションでは、デノイジングは映像から不要な粒子やセンサーノイズを取り除き、よりクリーンにすることを指します。
ひと目で分かる
- 別名
- 拡散プロセススコアマッチングノイズスケジューリング(学習プロセスにおいて)
- 用途
- AI画像・映像生成ポストプロダクションでのノイズ除去アップスケーリングと復元シードによる生成のランダム性の制御
- 主なツール
- Stable diffusionMidjourneySoraTopaz video AINeat videoDaVinci resolve
- 関連用語
- Diffusion modelLatent spaceCFG scaleStepsSeedSampling method
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
他の概念との比較
Compared with related concepts
ノイズ(AI生成)対ノイズ(ポストプロダクション):AI生成において、ノイズは意図的で生成的なものである。モデルが画像へと形作る、構造化された出発点だ。ポストプロダクションにおいて、ノイズはカメラのセンサー、フィルム粒子、または圧縮によって持ち込まれる不要なアーティファクトであり、デノイジングツールがそれを取り除こうとする。両分野は似たノイズの数学的モデルを使うが、意図は正反対である。
たとえば…
大理石のブロック(純粋なノイズ)から始め、内に隠れた像を現すために徐々に削り出す彫刻家を想像してほしい。鑿の一打ち一打ちがデノイジングのステップであり、彫刻家のビジョン(テキストプロンプト)が、どの素材を取り除き、どれを残すかを導く。最終的な彫刻は、無から積み上げるのではなく、属さないものを段階的に取り除くことで現れる。
プロのヒント
拡散ベースのAI生成では、デノイジングのステップ数を減らすと出力が大きく速くなるが、首尾一貫性が犠牲になる。出発点として中程度のステップ数(多くのサンプラーで20〜30)で試し、構造的な不整合が見られる場合にのみ増やすとよい。ポストプロダクションのデノイジングでは、ノイズパターンを増幅させないよう、シャープニングやディテール強調の前に必ずノイズ除去を適用すること。
種類とバリエーション
拡散ベースの生成では、ノイズスケジュールはさまざまである。モデルごとに学習と推論の際のノイズ付加・除去の速度が異なり、出力特性に影響する。ガウスノイズ(正規分布するランダム値)が標準だが、一部の研究は構造化されたノイズ形式を探求している。ポストプロダクションのデノイジングでは、アプローチに時間的デノイジング(時間にわたるフレーム間のノイズパターンの比較)、空間的デノイジング(単一フレーム内のノイズの分析)、AIベースのデノイジング(学習済みネットワークを使ってノイズと真のディテールを区別する)が含まれる。各アプローチは異なるタイプのノイズや映像に適しており、それらを組み合わせると、ノイズの多い素材で最良の結果が得られる。
Morphicで最初のシーンを作ってみませんか?
Morphicを試す主な活用シーン
ノイズとデノイジングは、2つの主要なクリエイティブAIユースケースの中心にある。第一に、AI生成において、Stable Diffusion、Midjourney、Sora、または類似のツールにプロンプトが送られるたびに、モデルはノイズテンソルから始め、それを反復的にデノイズして出力を生み出す。デノイジングのステップ数とガイダンススケールの調整が、主要なクリエイティブな制御である。第二に、ポストプロダクションにおいて、AIデノイジングは、露光不足や高ISOの映像を救済し、アーカイブのフィルムスキャンを整え、配信用素材の圧縮アーティファクトを減らし、ノイズが隠してしまうディテールを可視化するために使われる。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。
FAQ
サンプリング方法(サンプラーまたはスケジューラとも呼ばれる)とは、ノイズから画像へのデノイジングプロセスを進めるために使われるアルゴリズムです。サンプラー(DDIM、Euler、DPM++、PLMSなど)ごとに、速度と品質のトレードオフが異なります。より少ないステップで似た結果を出すものもあれば、特定の種類の被写体により適したものもあります。
シードとは、生成プロセスの開始時にランダムノイズを初期化するために使われる数値です。同じシードを同じプロンプトと設定で使うと同じ出力が再現されるため、シードは、残したい結果を失わずにコンポジションやスタイルを反復するのに不可欠です。
一定の閾値(ほとんどのモデルで通常30〜50ステップ)を超えると、追加のステップは収穫逓減となり、過度な平滑化やコンポジションのわずかなずれを招くことさえあります。一部の現代のサンプラーは、8〜12ステップで高品質な結果に到達するよう特別に設計されており、ステップ数よりもサンプラーの選択の方が重要になります。
従来のノイズ除去は、数学的フィルタを使ってピクセル値をぼかしたり平均化したりするため、その過程で細かいディテールを損なうことが多いです。AIデノイジングは、真のテクスチャやディテールとノイズパターンを区別するよう学習した学習済みニューラルネットワークを使うため、シャープさを保ちながら粒子をはるかに効果的に除去できます。
できます。生成でもポストプロダクションでも同様です。生成では、インペインティングによってマスクされた領域内にのみデノイジングを適用できます。DaVinci ResolveやTopaz Video AIのようなポストプロダクションツールでは、空間マスクによってデノイジングを影になった背景などの特定領域に限定し、他の領域では意図的な粒子やテクスチャを保てます。
CFG(クラシファイアフリー・ガイダンス)スケールは、テキストプロンプトがデノイジングプロセスをどれほど強く操舵するかを制御します。CFG値が高いほど、モデルはプロンプトをより厳格に従い、記述により近く整合した結果を生みますが、時として自然さを犠牲にします。値が低いほどモデルに自由が与えられ、より美的に好ましいがプロンプトへの忠実度は低い結果を生むことがあります。