Veo
VeoはGoogle DeepMindのAI動画生成モデルで、高品質なテキストから動画・画像から動画への生成分野へのGoogleの参入を代表する。DeepMindの他の生成AI研究とともに発表されたVeoは、テキストおよび画像プロンプトから高解像度で視覚的に一貫した動画クリップを生成する能力を示し、フロンティアAI動画生成の競争環境においてGoogleを重要な存在として位置づけた。
初代Veoモデルは、一貫したシーン構成、リアルな動き、カメラ移動の記述・照明条件・映画的スタイルといった撮影概念の理解を含む生成能力を示した。他のフロンティア動画生成モデルと同様、Veoは品質・安全性・Googleの広い製品・研究エコシステム内での大規模な生成動画の実運用を考慮して開発された。モデルはその後の開発の基盤として位置づけられ、Veo 2、Veo 3、Veo 3.1のモデルシリーズによる反復的改良が続いている。各版で品質・尺・制御能力が向上している。
Veoの登場は、拡散ベースの画像生成の成功を受けて、主要技術研究組織が動画生成に参入する流れを反映し、複数のフロンティアラボがそれぞれ最先端の動画生成能力を追求する競争構造を確立した。その開発の軌跡は、初期の能力デモから実用志向のモデル版と創造的応用へと、分野がどれだけ急速に進んだかを示している。