Runway GWM-1 (General World Model 1) est un modèle d’IA fondateur de Runway centré sur l’apprentissage de représentations du monde cohérentes et respectueuses de la physique, plutôt que sur la seule optimisation de la qualité de sortie vidéo. GWM-1 illustre la direction de recherche de Runway vers des modèles qui comprennent les relations spatiales, la permanence des objets et les dynamiques de cause à effet dans le monde physique, formant la couche de capacité sous-jacente qui rend la génération vidéo plus cohérente et plus maîtrisable.
La différence entre un modèle de génération vidéo et un modèle du monde est importante : un modèle de génération vidéo apprend à produire des séquences d’images plausibles, tandis qu’un modèle du monde développe une compréhension interne du fonctionnement des environnements, du comportement des objets et des conséquences des actions. Un modèle avec une meilleure compréhension du monde peut générer des scènes où les objets se comportent de façon cohérente d’une image à l’autre, où les interactions physiques semblent plausibles et où la logique de la scène tient dans le temps. GWM-1 reflète l’investissement de Runway dans cette capacité fondatrice comme moteur d’amélioration de la qualité de génération pour tous ses produits vidéo.
Pour les créateurs qui suivent l’évolution de la génération vidéo IA, le paradigme du modèle du monde représente une direction architecturale qui va au-delà du simple passage à l’échelle des approches existantes, en visant un modèle plus profond de la réalité physique et spatiale comme fondement de la qualité de génération. GWM-1 indique où se concentre la recherche de pointe dans ce domaine.