ノイズ / デノイジング
AI画像・映像生成の文脈において、ノイズとはランダムまたは半ランダムなデータ(通常、ガウス分布(釣鐘型)のランダムな値のテンソル)を指し、拡散モデルにおける生成プロセスの出発点として機能する。拡散モデルは、無から画像を構築することを学ぶのではなく、破壊プロセスの逆を学ぶ。すなわち、首尾一貫した画像にノイズを加えることで段階的に破壊する様子を観察し、その破壊を段階的に逆転させることを学習する。完全にノイズ化された画像は統計的に純粋なランダムノイズと区別がつかず、完全にデノイズされた画像は首尾一貫した視覚出力である。
デノイジングは、学習済みの拡散モデルがこの初期ノイズを意味のある画像や映像フレームに変換する反復的プロセスである。推論の各ステップで、モデルはそのステップで追加されたノイズを予測し、それを差し引いて、混沌から徐々に首尾一貫した画像を解像していく。デノイジング・ステップ数は重要なパラメータである。ステップが多いほど一般により高品質で首尾一貫した結果を生み出すが、計算に時間がかかる。ガイダンス機構(クラシファイアフリー・ガイダンスなど)は、テキストプロンプトや参照画像がデノイジングの軌道を操舵することを可能にし、出力を所望の被写体やスタイルに引き寄せる。
AI生成におけるノイズの概念は、信号処理と写真の長い歴史に基づいており、そこでノイズは信号や画像における望ましくないランダムな変動を指す。フィルム粒子、デジタルカメラのセンサーノイズ、音声ヒスはすべて、伝統的な意味でのノイズの形態である。AIにおいて、ノイズは除去されるべきものから生成の原材料そのものへと再目的化された。これは拡散モデルのパラダイムを生み出した深い概念的反転である。
生成AIを超えて、デノイジングは従来の画像・映像処理においても依然として重要である。AIベースのデノイジングツール(DaVinci Resolve、Topaz Video AI、Neat Videoなど)は、学習済みのニューラルネットワークを使用して、映像からセンサーノイズ、フィルム粒子、または圧縮アーティファクトを除去する。これらのツールは多くの例を通じてノイズがどのように見えるかを学習し、真のディテールを保持しながら画像からそれを差し引く。これは挑戦的な素材において、従来の時間的・空間的フィルタリングのアプローチを大きく上回る性能を発揮する。
創ってみませんか?
シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる
シンプルで透明性の高い料金体系、速度制限なし、無限のCanvasで創造性を最大化する、オールインワンのAIクリエイティブプラットフォーム。