敵対的生成ネットワーク(GAN)
Generative Adversarial Network(GAN、敵対的生成ネットワーク)は、互いに対立する形で学習する2つのニューラルネットワーク、生成器と識別器で構成される機械学習アーキテクチャである。生成器は実データに似せた合成データを作り、識別器は実サンプルと生成サンプルを区別しようとする。この敵対的プロセスを通じて両ネットワークが改善し、生成器が識別器を欺けるほど説得力のある出力を出すまで学習が進む。
GANは2014年に発表され、2010年代後半のAI画像生成の主流となり、フォトリアリスティックな合成、スタイル転送、画像間変換で大きな進展をもたらした。代表的なGANアーキテクチャには、高品質な顔生成のStyleGAN、ペアなし画像変換のCycleGAN、ペア画像変換のPix2Pixがある。ただし、GANは歴史的に学習が難しく、限定的な多様性しか生まないモード崩壊を起こしやすく、学習の安定性を保つには慎重なバランス調整が必要だった。
拡散モデルが安定性と品質の高さから現代の画像生成の主流アーキテクチャとしてGANに取って代わった今日でも、GANはAIの歴史において重要であり、特定用途で使われ続けている。GANを理解することは、生成AIの進化の文脈を提供し、現在の拡散ベースのモデルが分野において大きなアーキテクチャ転換を表す理由を説明する助けとなる。