디퓨전 모델
디퓨전 모델이란?
디퓨전 모델은 무작위 노이즈에서 시작해 단계별로 점진적으로 정리해 나가면서 텍스트 프롬프트나 다른 지시에 맞는 일관된 그림이 나타날 때까지 이미지를 만드는 법을 학습합니다.
한눈에 보기
- 다른 이름
- 디노이징 디퓨전 모델스코어 기반 생성 모델잠재 디퓨전 모델(잠재 공간 변형의 경우)
- 주요 용도
- 텍스트-이미지 생성이미지 편집 및 인페인팅영상 생성오디오 생성커스텀 모델 파인튜닝
- 주로 쓰이는 도구
- Stable diffusionDALL-e 2DALL-e 3MidjourneyImagenAI video generation platforms
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.
다른 개념과의 비교
Compared with related concepts
디퓨전 모델 대 GAN: 적대적 생성 신경망, 즉 GAN은 디퓨전 모델 이전의 지배적인 이미지 생성 아키텍처였습니다. GAN은 생성기와 판별기라는 두 개의 경쟁 네트워크를 사용해 적대적으로 학습합니다. 선명한 이미지를 만들어 낼 수 있지만, GAN은 학습이 불안정하고, 모드 붕괴에 취약하며, 출력의 다양성이 떨어집니다. 디퓨전 모델은 더 안정적이고, 더 큰 다양성을 만들어 내며, 컨디셔닝을 더 안정적으로 처리하고, 추가 연산에 따라 더 잘 확장되며, 이것이 고품질 이미지 및 영상 생성의 지배적 접근 방식으로서 GAN을 대체한 이유입니다.
프로 팁
디퓨전 기반 도구를 사용할 때, 인터페이스에서 흔히 추론 단계 또는 샘플링 단계라고 불리는 디노이징 단계의 수는 품질과 생성 시간 모두에 직접적인 영향을 미칩니다. 단계가 많을수록 모델이 이미지를 다듬을 기회가 많아져 일반적으로 더 나은 디테일과 일관성을 만들어 내지만, 각 단계는 시간이 걸립니다. 빠른 콘셉트 탐색에는 낮은 단계 수가 사용 가능한 결과를 빠르게 만들어 냅니다. 최종 품질의 생성에는 높은 단계 수가 모델에서 더 많은 디테일을 끌어냅니다. 용도에 허용 가능한 품질을 만들어 내는 최소 단계 수를 찾는 것이 속도와 출력 품질을 균형 잡는 실용적인 방법입니다.
유형과 변형
- 픽셀 공간 디퓨전 모델은 풀 해상도 이미지 픽셀에 직접 작동하며 상당한 연산 자원을 필요로 합니다.
- Stable Diffusion을 포함한 잠재 디퓨전 모델은 픽셀에 직접 작동하는 대신 압축된 잠재 공간에서 작동하여, 출력 품질을 유지하면서 연산 요구량을 크게 줄입니다.
- 스코어 기반 모델은 수학적으로 관련된 접근 방식으로, 다른 정식화를 통해 유사한 생성 품질을 달성합니다.
- 영상 디퓨전 모델은 이 아키텍처를 시간 차원으로 확장하여 개별 이미지가 아닌 일관된 프레임 시퀀스를 생성합니다.
Morphic에서 첫 장면을 만들어 볼까요?
Morphic 체험하기주요 활용 사례
- 창작, 상업, 연구 응용 전반에 걸쳐 텍스트 프롬프트로부터 이미지 생성.
- 디퓨전 기반 생성을 사용해 영역을 대체하거나 확장함으로써 기존 이미지를 인페인팅 및 아웃페인팅하기.
- 사전 학습된 디퓨전 모델을 커스텀 데이터셋으로 파인튜닝하여 특화된 캐릭터 모델, 스타일이 일관된 생성기, 또는 도메인 특화 도구 제작.
- 여러 프레임에 걸쳐 일관된 모션을 만들어 내는 시간적 디퓨전 모델 아키텍처를 사용한 영상 생성.
- 디퓨전 모델 프레임워크를 활용한 생성형 AI 역량, 정렬, 안전성 연구.
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.