Question 1

画像から画像へのAI生成とは何ですか?

Accepted Answer

画像から画像は、既存の画像がテキストプロンプトと並んで入力として機能し、モデルがその構図や構造の側面を保ちつつソースを変換する生成ワークフローです。視覚的な出発点なしに書かれた記述から完全に構築するテキストから画像への生成とは異なります。

Question 2

画像から画像におけるノイズ除去強度とは何ですか?

Accepted Answer

ノイズ除去強度は、モデルがソース画像をどれだけ変換するかをコントロールします。低い値(0に近い)では、出力はわずかな変更でソースに酷似します。高い値(1に近い)では、ソースは大まかな構造的な示唆のみを提供し、モデルは実質的な変換を適用します。最適な値は、オリジナルの構図をどれだけ保つか、あるいは再構想するかによります。

Question 3

画像から画像はテキストから画像とどう違いますか?

Accepted Answer

テキストから画像は、視覚的な出発点なしにランダムなノイズから始めて、書かれた記述から完全に画像を生成します。画像から画像は、既存の画像を部分的な初期化として使い、すでに視覚的な構造が備わった状態でノイズ除去プロセスを開始し、テキストプロンプトは、構図全体をゼロから記述するのではなく、その構造がどう変換されるかを導きます。

Question 4

img2imgとは何ですか?

Accepted Answer

img2imgは画像から画像の一般的な略称で、Stable Diffusionコミュニティやツールのインターフェースで広く使われています。この用語は互換的に使われ、既存の画像をテキストプロンプトと並んで入力として使い変換を導く、同じ生成アプローチを指します。

Question 5

画像から画像を使って写真のスタイルを変えられますか?

Accepted Answer

はい。構図を保ちつつ写真に芸術的なスタイルを適用することは、画像から画像への生成の最も一般的な用途の一つです。中程度のノイズ除去強度を設定し、スタイルを記述するプロンプトを含めることで、モデルは被写体、フレーミング、空間的関係を保ちつつ、写真の視覚的処理を変換できます。

Question 6

ControlNetとは何で、画像から画像とどう関連しますか?

Accepted Answer

ControlNetは拡散モデルの条件付き制御システムで、ソース画像から抽出された構造情報(エッジマップ、深度マップ、ポーズスケルトンなど)を、直接のピクセル初期化ではなく正確な条件付けとして使います。画像ベースの条件付けのより高度な形で、標準的なimg2imgよりはるかに信頼性高く特定の構造的品質を保てるようにし、キャラクターのポーズ制御、建築レイアウトの一致、その他正確な構造的遵守が重要なケースで広く使われています。

Question 7

画像から画像とインペインティングの違いは何ですか?

Accepted Answer

画像から画像は、ソースの視覚的構造に導かれて、画像全体またはその実質的な部分に変換を適用します。インペインティングは、マスクされた領域に特定して生成を適用し、マスクされていない領域を変更しないままにします。それ以外は受け入れられる画像の特定の小さな領域を補正・置換するには、インペインティングがより正確です。構図全体に全面的なスタイル変換を適用するには、画像から画像がより適切なアプローチです。

Question 8

画像から画像はどんな入力を必要としますか?

Accepted Answer

標準的な画像から画像は、ソース画像、望ましい出力を記述するテキストプロンプト、ノイズ除去強度の値を必要とします。一部のワークフローは、望ましくない要素を除外するネガティブプロンプト、再現性のためのシード値、モデル固有のパラメーターなどの追加の条件付けを加えます。ControlNetを使うより高度なワークフローでは、ソース画像からどのタイプの構造的条件付けを抽出するかの指定も必要です。

Image-to-Image(画像から画像)

Image-to-Image(画像から画像)とは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ