Question 1

GAN은 무엇의 약자인가요?

Accepted Answer

GAN은 생성적 적대 신경망(Generative Adversarial Network)의 약자입니다. '적대적'은 학습 과정을 이끄는 두 네트워크(생성자와 판별자) 사이의 경쟁 관계를 가리킵니다.

Question 2

GAN은 누가 발명했나요?

Accepted Answer

GAN은 2014년 논문에서 몬트리올 대학교의 이안 굿펠로와 동료들이 도입했습니다. 이 아이디어는 술집에서의 토론 중에 떠올라 같은 날 저녁에 작동하는 프로토타입으로 발전한 것으로 전해집니다.

Question 3

GAN은 오늘날에도 여전히 사용되나요?

Accepted Answer

네, 다만 디퓨전 모델이 이미지 및 영상 생성 품질의 지배적 아키텍처로 자리 잡았습니다. GAN은 실시간 영상 향상, 얼굴 생성, ESRGAN 같은 업스케일링 도구, 그리고 추론 속도가 우선인 응용에서 여전히 널리 사용됩니다.

Question 4

GAN에서 모드 붕괴란 무엇인가요?

Accepted Answer

모드 붕괴는 생성자가 학습 데이터의 전체 다양성 대신 판별자를 확실히 속이는 좁은 범위의 출력만 생성하도록 학습하는 학습 실패입니다. 예를 들어 얼굴 GAN이 비슷하게 생긴 몇 개의 얼굴만 생성하도록 붕괴할 수 있습니다. 이는 GAN 학습의 핵심 과제 중 하나입니다.

Question 5

GAN은 디퓨전 모델과 어떻게 다른가요?

Accepted Answer

GAN은 생성자 네트워크를 통한 단일 패스로 출력을 생성하여 빠릅니다. 디퓨전 모델은 여러 단계에 걸쳐 반복적으로 노이즈를 제거하여 출력을 생성하며, 이는 더 느리지만 일반적으로 더 다양하고 더 높은 품질의 결과를 만듭니다. 대부분의 최첨단 생성 도구는 이제 디퓨전 모델을 사용합니다.

Question 6

StyleGAN이란 무엇인가요?

Accepted Answer

StyleGAN은 NVIDIA가 개발한 매우 영향력 있는 GAN 아키텍처로, 생성된 이미지 속성에 대한 스타일 기반 제어를 도입하여 얼굴 및 인물 생성에 전례 없는 품질과 제어를 가능하게 했습니다. 여러 버전(StyleGAN2, StyleGAN3)을 거쳤으며 가장 많이 연구된 GAN 변형 중 하나로 남아 있습니다.

Question 7

GAN은 이미지뿐 아니라 영상도 생성할 수 있나요?

Accepted Answer

네. 영상 GAN은 적대적 학습 프레임워크를 시간적 시퀀스로 확장하여, 일관된 다중 프레임 클립을 생성하도록 생성자를 학습시킵니다. 예로는 VideoGAN과 MoCoGAN이 있습니다. 그러나 GAN의 영상 생성 품질은 결국 디퓨전 기반 영상 모델에 추월당했습니다.

생성적 적대 신경망(Generative Adversarial Network, GAN)

생성적 적대 신경망(Generative Adversarial Network, GAN)이란?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

유형과 변형

Morphic에서 첫 장면을 만들어 볼까요?

주요 활용 사례

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

FAQ