Question 1

ControlNetとは何ですか？

Accepted Answer

ControlNetは、ポーズマップ、エッジマップ、深度マップといった構造的入力画像で生成プロセスをコンディショニングすることにより、画像生成モデルに空間的制御を加えるニューラルネットワークアーキテクチャです。テキストプロンプトだけよりもはるかに高い精度で、生成出力の構図的・空間的構造をクリエイターが指定できるようにします。

Question 2

ControlNetはどう機能しますか？

Accepted Answer

ControlNetは、ベースとなる拡散モデルと並行して構造的な制御画像を処理する追加のニューラルネットワークモジュールを訓練します。これらのモジュールは制御入力から空間情報を抽出し、それをコンディショニングとして生成プロセスに渡し、ベースモデルの視覚スタイルを上書きすることなく、要素が出力のどこに現れるかを制約します。

Question 3

ControlNetはどのような制御入力に対応していますか？

Accepted Answer

ControlNetは、身体位置制御のためのポーズマップ、構造線制御のためのエッジマップ、空間的奥行き関係のための深度マップ、領域コンテンツ制御のためのセグメンテーションマップ、表面ジオメトリ制御のためのノーマルマップなどに対応しています。複数の制御タイプを同時に使うこともできます。

Question 4

ControlNetとimage-to-image生成の違いは何ですか？

Accepted Answer

image-to-imageは参照画像を直接使い、構造と視覚的コンテンツの両方に影響します。ControlNetは参照から特定の構造情報を抽出し、それだけを空間的制約として用いるため、テキストとベースモデルが参照の見た目とは独立に視覚的コンテンツとスタイルを決定できます。

Question 5

ポーズControlNetは何に使いますか？

Accepted Answer

ポーズControlNetはスケルトンキーポイントマップを使い、生成キャラクターが特定の身体位置に一致するようにします。同一ポーズでのキャラクターバリエーション生成、製品やファッションのビジュアライゼーションでの参照ポーズの一致、複数の生成にわたる一貫したキャラクターの立ち姿の確保に広く使われます。

Question 6

ControlNetはどの画像生成モデルでも使えますか？

Accepted Answer

ControlNetモジュールはアーキテクチャ固有であり、ベースモデルと互換性がある必要があります。ControlNet開発の大半はStable Diffusionとその派生向けに行われてきました。各ベースモデルのアーキテクチャには、その特定のアーキテクチャ向けに訓練された独自のControlNetモジュールが必要です。

Question 7

ControlNetの重みとは何を意味しますか？

Accepted Answer

ControlNetの重みは、制御モジュールの空間的コンディショニングが生成出力にどれだけ強く影響するかを制御します。重みが高いほど制御画像により正確に従う出力になりますが、視覚的品質が低下する場合があります。重みが低いほど生成の自由度が増しつつ、方向性のある空間的ガイダンスを適用できます。

Question 8

ControlNetは商用AIツールで使われていますか？

Accepted Answer

ControlNetの原理は多くの商用AI生成ツールで使われたり参照されたりしていますが、実装は様々です。このアーキテクチャはオープンソースのStable Diffusionエコシステムで生まれ、より広範な商用・研究向けAI生成プラットフォームで空間制御機能がどう開発されるかに影響を与えてきました。

ControlNet

ControlNetとは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ