Imagen (Google)
Imagenは、Google Researchが開発したGoogleのテキストから画像へのAI生成モデルで、同社の消費者向け画像合成技術への参入を表す。大規模言語モデルの基盤と拡散ベースの画像生成を組み合わせ、強いプロンプト理解とフォトリアリスティックな出力品質を重視している。
Imagenは当初、Googleの生成AIの能力を示す研究デモとしてリリースされ、複雑で詳細なプロンプトの正確な解釈と、説得力のある照明・質感・構図を持つフォトリアリスティックな画像の生成を特に重視した。導入時点でプロンプト遵守ベンチマークと画質指標で最先端の性能を示し、DALL-E 2やStable Diffusionなど当時のモデルと直接競合した。
Googleは画像生成技術の広範な公開について競合より慎重で、安全性と責任ある展開への懸念を理由にしているが、Imagenは同社のこの分野における技術力を表し、製品エコシステム全体でのGoogleの生成AI提供のその後の開発に影響を与えている。