パイプライン
Pappu Express はたった一文から始まり、何百万回も再生される映像として完成しました。そのすべてを Morphic の中で作っています。全体は8つの段階で組み上がり、進行を支えたたったひとつの習慣はシンプルでした。次の段階に進む前に、いまの段階を必ず終わらせること。どのステップも、ひとつ前のステップに支えられているからです。ここでは私たちがどう進めたかを、各段階でどんなディレクションを与えたかが伝わるように、例となるプロンプトを添えて紹介します。

1.
脚本
すべては物語から始まるので、私たちもそこから始めました。Copilot に設定を一行で渡し、全体を書き起こすよう頼みました。返ってきたのは、幕、シーン、ビートごとのアクションまで備えた本格的な脚本でした。そしてこの脚本が、あとで生成するすべてのショットの地図になりました。
この物語の詳しい脚本を書いてください:
逃げ出した花嫁が Pappu に、20分で空港まで連れて行ってと頼む。彼は理由を聞かない。離陸用に作られたかのように、街中をリキシャで全速力で突っ走るだけだ。

2.
スタイル固め
キャラクターを一人描く前に、まず見た目を決めました。求める世界観を言葉で説明し、使い捨ての被写体を使ってフレームをいくつか Copilot に生成させて、スタイルだけに集中して反応できるようにしました。気に入るフレームがいくつか出てきたら、それが下流のすべてが従うリファレンスになりました。
このアートスタイルで画像を生成してください:
スタイライズド3Dアニメーション調、誇張されたプロポーション、立体的な造形に絵画的なテクスチャ、筆跡の見える彩度の高い色、インクの染みのような目、暖かいリムライト、ボケた背景、活気あるインドのアニメーションの雰囲気、ゴールデンアワーのフィルライト。スタイルリファレンスのみ、新しいキャラクターとロケーション。

3.
キャラクターシート
見た目が固まったら、登場人物を呼び込みます。先ほどのスタイルフレームをリファレンスとして渡し直し、同じキャラクターを複数の角度からとらえた完全なキャラクターシートを頼みました。こうすれば、あるショットから次のショットへ顔が同じ顔のまま保たれます。体格、衣装、細部を具体的に指定すればするほど、後のショットすべての一貫性が高まりました。
スタイライズド3Dカートゥーン調のインド人リキシャ引きのキャラクターシートを生成してください。大きな丸い頭、小さな体、細い手足、巨大で平らな黒い口ひげ、インクの染みのような目、金歯が一本。サフラン色の水玉模様の lungi、汚れた白いベスト、緑の布の turban、左右ちぐはぐな chappals。リラックスして頭を傾けたポーズ、暖かいリムライト、絵画的な路地、全身の正面ビュー。

4.
環境ビジュアル
ロケーションもまったく同じやり方です。スタイルリファレンスは同じで、被写体だけ新しくします。必要な場所を一つひとつ、色、光、テクスチャまで言葉で説明し、リファレンスを指し示して、登場人物と同じ世界に収まるようにしました。これが登場人物が動き回るセットになります。同じリファレンスでそろえておくことこそ、カットが寄せ集めの画像ではなく、ひとつの場所として感じられる秘訣です。
ゴールデンアワーの Old Delhi の路地を手描きで、絵画的な筆跡のテクスチャで。マスタード、テラコッタ、ピンク、ティールに塗られた崩れかけた植民地時代の建物、ヒンディー語の看板、絡み合う頭上の電線、干された洗濯物、神々の壁画、マリーゴールドの寺院、湯気の立つ屋台。涼しい夕暮れの影に温かい街灯が溜まり、手前にボケ、輝く塵の霞、彩度の高いパレット、表情豊かなアニメーションの静止画調、8K。スタイルリファレンスには画像1を使ってください。

5.
キーフレームの生成
登場人物と世界がそろったので、キーフレーム、つまり各ショットを決定づける一枚の画像を作りました。キャラクターシートとロケーションを一緒に添付し、その瞬間を説明します。誰がフレームに入っていて、どこにいて、何が起きているのか。アニメーションを始める前に、これをすべてのビートについて行いました。だから動かし始める頃には、各ショットがどう見えるべきかをすでに正確に把握していました。
画像1はキャラクターリファレンスシート。画像2は全体の舞台リファレンスです。
インドの paan 屋に二人のキャラクター。左のキャラクター:陽気な年配の paanwala、禿げ頭に白い Gandhi topi、もじゃもじゃの白いハンドルバー口ひげと太い白い眉、丸いワイヤーフレームの眼鏡、カウンターの奥で働いている。右のキャラクター:身を乗り出して注文する Pappu。ゴールデンアワーの光、絵画的なアニメーションスタイル、16:9。

6.
ショットのアニメーション化
ここで静止画が動き始めます。完成したキーフレームを Copilot に渡し、欲しい動き、つまりアクション、タイミング、カメラの動きを説明して、生成させました。各ショットは必ず数バージョン頼みます。ベストなテイクが最初のものであることはまずないからです。各バッチの中からうまくいったバージョンを残して、次へ進みました。
dabba wala のおじさんがのんびり自転車をこいでいると、突然 Pappu Express がありえない速度で左からフレームに飛び込んでくる。時間がスローになり、tiffin の弁当箱が自転車から上空に打ち上げられ、すばやく元どおりの順序にきれいに着地する。
合計5本の動画を生成してください。

7.
サウンドデザイン
追いかけっこは、音が良くてこそ生きます。だからこの段階には本腰を入れました。Canvas の中で、必要な音楽、効果音、そして少しの声を生成しました。スコアはジャンル、楽器、テンポ、ムードを普通の言葉で説明するだけで、映像にぴたりと合うまで生成し直しました。コメディを成立させるのは音です。
速くてコミカルなインドのインストゥルメンタル、すべての拍で目立つ tabla、弾むような sarangi/harmonium のメロディ、dholak のフィル、フルートのトリル、ドタバタ追跡劇のエネルギー、長調、約150BPM、ボーカルなし、遊び心がありせわしない。

8.
編集
最後に、すべてが Compose で一つにまとまります。クリップをタイムラインに並べ、それぞれをトリミングし、物語の順に並べ替え、その下に音楽と効果音を敷きました。この最後の一手こそが、バラバラの生成物が入ったフォルダを、ちゃんと一本の映像として再生できるものに変えてくれます。じっくり時間をかける価値があります。

完成した映像を見る
これがパイプラインのすべてです。一行のアイデアから、一本の完成した短編まで。仕上がりはこちらです。すでに 1100万回 以上再生され、9,000件以上 のいいねを獲得し、今も増え続けています。

