変身(トランスフォーメーション)ショットは、AI映像ツールが生成できる最も独自的に生成的なものの一つであり、モデルの視覚概念への学習に基づく理解を利用して、実写の映画制作では高コストまたは不可能な状態間の補間を行う。人物が鳥に溶けていく、都市景観が一つの連続ショットで昼から夜に移る、顔が数秒で何十年も老化するといった効果は、従来は大がかりなVFX作業が必要だったが、慎重なプロンプティングと生成でアプローチできるようになった。
AI映像生成では、トランスフォーメーションとは、クリップの経過にわたって被写体が形、外見、アイデンティティを目に見えて変えるショットまたはシークエンスを指す。二つの状態間のカットではなく、連続した視覚的出来事として一つの状態からもう一つへモーフィングする。トランスフォーメーションでは、人物の老化、季節の変化、オブジェクトがまったく別のものに変態する、視覚スタイルが一つの美学からもう一つへ流動的にシフトする、といったことが示されうる。結果の品質は、プロンプトで開始状態と終了状態がどれだけ明確に定義されているか、およびモデルが学習に基づいてそれらの間をどれだけ自然に補間できるかに大きく依存する。
トランスフォーメーションのプロンプティングは、開始状態と終了状態の両方を明確かつ具体的に記述し、二つの状態間のカットではなく連続した変化を示唆する言語を使うと最も効果的である。「シームレスに〜に変身する」「XからYへ徐々にモーフする」「一つの形からもう一つへ連続的にシフトする」といったフレーズは、意図した効果のショット内の性質を伝える助けになる。開始状態の強い参照画像から始めて画像から映像への生成を使うと、トランスフォーメーションの開始点の正確な視覚的アンカーをモデルに与え、クリップを通じて展開する変化のコヒーレンスと品質が向上する。