잠재 공간
Latent Space(잠재 공간)는 AI 모델이 내부적으로 콘텐츠를 이해하고 생성할 때 쓰는, 데이터의 압축된 추상 수학적 표현입니다. AI 이미지·영상 모델은 원시 픽셀이나 프레임을 직접 다루기보다 시각 정보를 해당 데이터의 핵심 특징과 관계를 훨씬 더 압축된 형태로 담는 고차원 숫자 공간으로 변환합니다.
디퓨전 모델이 이미지를 생성할 때 노이즈 제거 과정은 보통 픽셀 공간이 아니라 잠재 공간에서 일어납니다. 모델이 압축된 표현으로 작업한 뒤 최종 결과만 실제 픽셀로 디코딩하므로 연산이 훨씬 효율적입니다. 잠재 공간은 원시 픽셀 값뿐 아니라 의미 정보를 인코딩합니다. 즉 모델의 내부 표현은 "개", "달리기", "푸른 하늘" 같은 개념을 이 추상 수학 공간 안의 위치와 영역으로 담습니다. Stable Diffusion 같은 모델에서 쓰이는 latent diffusion 같은 기법은 잠재 공간을 탐색하며 콘텐츠를 생성하는 이 접근에서 이름을 땄습니다.
잠재 공간을 이해하면 AI 모델이 개념을 섞고, 스타일 사이를 보간하며, 비슷한 프롬프트가 비슷하지만 다른 출력을 내는 이유를 설명하는 데 도움이 됩니다. 모델의 잠재 공간 구조가 창작 범위와 일관되고 새로운 방식으로 아이디어를 결합하는 능력을 근본적으로 결정합니다.