Le pipeline
Pappu Express a commencé par une seule phrase et s'est terminé en un film visionné des millions de fois, le tout réalisé dans Morphic. Il a pris forme en huit étapes, et la seule habitude qui a tout maintenu sur les rails était simple : terminer chaque étape avant de commencer la suivante, car chaque étape s'appuie sur la précédente. Voici comment nous avons procédé, avec un exemple de prompt pour chaque étape afin de montrer le type de direction que nous avons donné.

1.
Le scénario
Tout commence par l'histoire, alors c'est là que nous avons commencé nous aussi. Nous avons donné la prémisse à Copilot en une seule phrase et lui avons demandé de tout rédiger. Ce qui est revenu était un véritable scénario, avec des actes, des scènes et une action décrite beat par beat, et ce scénario est devenu la carte de chaque plan que nous allions générer par la suite.
Donne-moi un scénario détaillé pour cette histoire :
Une mariée en fuite donne à Pappu vingt minutes pour l'emmener à l'aéroport. Il ne demande pas pourquoi, il lance simplement son rickshaw à travers la ville comme s'il était conçu pour décoller.

2.
Verrouillage du style
Avant de dessiner le moindre personnage, nous avons fixé le rendu. Nous avons décrit le monde que nous recherchions et avons fait générer à Copilot quelques images avec des sujets jetables, afin de ne réagir qu'au style et à rien d'autre. Dès que deux ou trois images nous ont semblé justes, elles sont devenues la référence que tout le reste allait suivre.
Génère des images dans ce style artistique :
Rendu d'animation 3D stylisée, proportions exagérées, texture façon peinture sur des formes volumétriques, couleurs saturées avec coups de pinceau visibles, yeux en taches d'encre, lumière de contour chaude, arrière-plan en bokeh, ambiance vibrante d'animation indienne, lumière de remplissage golden hour. Référence de style uniquement, nouveau personnage et nouveau lieu.

3.
Fiches de personnages
Une fois le rendu verrouillé, nous avons fait entrer les personnages. Nous avons réinjecté ces images de style comme référence et demandé des fiches de personnages complètes, le même personnage sous plusieurs angles, pour qu'un visage reste le même visage d'un plan à l'autre. Plus nous étions précis sur la morphologie, les vêtements et les petits détails, plus chaque plan ultérieur restait fidèle au modèle.
Génère une fiche de personnage d'un conducteur de rickshaw indien en dessin animé 3D stylisé, grosse tête ronde, petit corps, membres fins, énorme moustache noire bien plate, yeux en taches d'encre, une dent en or. Lungi saffron à pois, débardeur blanc taché, turban en tissu vert, chappals dépareillées. Pose détendue avec la tête inclinée, lumière de contour chaude, rue façon peinture, vue de face en plein pied.

4.
Visuels d'environnement
Les lieux fonctionnent exactement de la même manière : même référence de style, nouveau sujet. Nous avons décrit chaque endroit dont nous avions besoin, la couleur, la lumière, la texture, et nous avons pointé vers la référence pour qu'il s'inscrive dans le même monde que les personnages. Ces lieux sont devenus les décors dans lesquels nos personnages allaient évoluer, et les garder sur la même référence est ce qui fait qu'un montage donne l'impression d'un seul lieu plutôt que d'une douzaine d'images sans rapport.
Ruelle d'Old Delhi peinte à la main à la golden hour, textures façon coups de pinceau. Bâtiments coloniaux délabrés dans des tons moutarde, terre cuite, rose et sarcelle, enseignes en hindi, fils aériens emmêlés, linge suspendu, fresques de divinités, un temple couvert de soucis, étals de street food fumants. Réverbères chauds formant des flaques de lumière contre des ombres froides de crépuscule, bokeh au premier plan, brume de poussière lumineuse, palette saturée, rendu expressif d'image d'animation, 8K. Utilise l'image 1 comme référence de style.

5.
Génération des images clés
Maintenant que nous avions des personnages et un monde, nous avons construit les images clés, l'image unique qui définit chaque plan. Nous avons attaché la fiche de personnage et le lieu ensemble, puis décrit le moment : qui est dans le cadre, où ils se trouvent et ce qui se passe. Nous avons fait cela pour chaque beat avant d'animer quoi que ce soit, de sorte qu'au moment de mettre les choses en mouvement, nous savions déjà exactement à quoi chaque plan devait ressembler.
L'image 1 est la fiche de référence du personnage. L'image 2 est la référence du décor d'ensemble.
Deux personnages devant une échoppe de paan indienne. Personnage de gauche : un joyeux paanwala âgé, chauve avec une Gandhi topi blanche, une grosse moustache blanche en guidon et d'épais sourcils blancs, des lunettes rondes à monture métallique, travaillant derrière son comptoir. Personnage de droite : Pappu se penchant pour commander. Lumière golden hour, style d'animation façon peinture, 16:9.

6.
Animation des plans
C'est ici que les images fixes se mettent à bouger. Nous avons donné à Copilot une image clé finalisée et décrit le mouvement que nous voulions, l'action, le timing, le mouvement de caméra, puis nous l'avons laissé générer. Nous demandions toujours plusieurs versions de chaque plan, car la meilleure prise n'est presque jamais la première. Dans chaque lot, nous gardions la version qui fonctionnait et nous passions à la suite.
L'oncle dabba wala pédale tranquillement sur son vélo, et soudain Pappu Express déboule dans le cadre par la gauche à une vitesse impossible. Le temps ralentit, les boîtes tiffin sont projetées vers le haut depuis le vélo et retombent prestement en ordre parfait.
Génère 5 vidéos au total.

7.
Design sonore
Une course-poursuite ne vaut que ce que vaut son ambiance sonore, alors cette étape a reçu une vraie attention. Dans le Canvas, nous avons généré la musique, les effets sonores et les bribes de voix dont nous avions besoin. Pour la bande originale, nous l'avons simplement décrite avec des mots simples, le genre, les instruments, le tempo, l'ambiance, et nous avons régénéré jusqu'à ce qu'elle se cale sur l'image. Le son est ce qui fait mouche pour la comédie.
Instrumental indien comique et rapide, tabla bien présent sur chaque temps, mélodie bondissante de sarangi/harmonium, fills de dholak, trilles de flûte, énergie de course-poursuite burlesque, tonalité majeure, ~150 BPM, sans voix, enjoué et frénétique.

8.
Montage
Enfin, tout s'est assemblé dans Compose. Nous avons déposé les clips sur la timeline, raccourci chacun, mis en ordre selon l'histoire, et placé la musique et les effets en dessous. Cette dernière passe est ce qui transforme un dossier de générations séparées en quelque chose qui se regarde vraiment comme un film, et cela vaut la peine d'y prendre son temps.

Regarder le film terminé
Voilà tout le pipeline, d'une idée d'une seule ligne à un court métrage terminé. Voici le résultat. Il a déjà été visionné plus de 11 millions de fois et a recueilli plus de 9 000 likes, et le compteur continue de tourner.

