Question 1

GANは何の略ですか？

Accepted Answer

GANは敵対的生成ネットワーク（Generative Adversarial Network）の略です。「敵対的（adversarial）」は、学習プロセスを駆動する2つのネットワーク（生成器と識別器）の間の競争的な関係を指します。

Question 2

GANは誰が発明しましたか？

Accepted Answer

GANは2014年の論文でイアン・グッドフェローとモントリオール大学の同僚たちによって導入されました。このアイデアはパブでの議論中に着想され、同じ晩に動作するプロトタイプへと発展したと伝えられています。

Question 3

GANは今でも使われていますか？

Accepted Answer

はい、ただし拡散モデルが画像・映像生成の品質において支配的なアーキテクチャとして取って代わりました。GANはリアルタイムの映像強化、顔生成、ESRGANのようなアップスケーリングツール、そして推論速度が優先されるアプリケーションで依然として広く使われています。

Question 4

GANにおけるモード崩壊とは何ですか？

Accepted Answer

モード崩壊とは、生成器が学習データの完全な多様性ではなく、識別器を確実に欺く狭い範囲の出力だけを生成するよう学習してしまう学習の失敗です。たとえば、顔のGANが似たような数個の顔だけを生成するように崩壊することがあります。これはGANの学習における重要な課題の一つです。

Question 5

GANは拡散モデルとどう違いますか？

Accepted Answer

GANは生成器ネットワークを通る単一のパスで出力を生成するため高速です。拡散モデルは多くのステップにわたって反復的にノイズ除去することで出力を生成し、より遅いものの一般により多様で高品質な結果を生みます。最先端の生成ツールのほとんどは今や拡散モデルを使っています。

Question 6

StyleGANとは何ですか？

Accepted Answer

StyleGANはNVIDIAが開発した非常に影響力のあるGANアーキテクチャで、生成される画像の属性に対するスタイルベースの制御を導入し、顔やポートレートの生成において前例のない品質と制御を可能にしました。複数のバージョン（StyleGAN2、StyleGAN3）を経ており、最もよく研究されたGANのバリアントの一つであり続けています。

Question 7

GANは画像だけでなく映像も生成できますか？

Accepted Answer

はい。映像GANは敵対的学習のフレームワークを時間的なシークエンスへと拡張し、一貫した複数フレームのクリップを生成するよう生成器を学習させます。例にはVideoGANやMoCoGANがあります。ただし、GANによる映像生成の品質は最終的に拡散ベースの映像モデルに追い抜かれました。

敵対的生成ネットワーク（GAN）

敵対的生成ネットワーク（GAN）とは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ