Stable Diffusion
Stable Diffusion이란?
Stable Diffusion은 텍스트 묘사로부터 이미지를 생성하는 무료 오픈소스 AI 모델로, 누구나 다운로드하고 수정할 수 있어 수많은 AI 크리에이티브 도구의 기반이 되었습니다.
한눈에 보기
- Type of model
- Open-source latent diffusion text-to-image generation model
- Developed by
- Stability AI, with research contributions from LMU Munich and Runway ML
- Key capability
- High-quality text-to-image generation, img2img, inpainting, and outpainting; foundational architecture for a large ecosystem of fine-tuned models and extensions
- How it fits in AI workflow
- Used for image generation, concept art, character and environment design, img2img refinement, compositing support, and as the base architecture for many specialised image and video generation tools
- 관련 용어
- Diffusion modelCLIPLoRAControlNetLatent spaceMidjourneyAUTOMATIC1111
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.
다른 개념과의 비교
Stable Diffusion은 오픈소스로, 로컬에서 실행할 수 있고 파인튜닝과 확장을 통한 깊은 커스터마이징을 제공하는 반면, Midjourney는 로컬 배포가 없는 호스팅 독점 서비스입니다. Midjourney는 일반적으로 더 적은 프롬프트 노력으로 곧바로 미적으로 더 다듬어진 결과를 만들어 내고, Stable Diffusion은 전문 및 연구 워크플로를 위한 훨씬 더 큰 기술적 제어, 커스터마이징 가능성, 유연성을 제공합니다.
프로 팁
프로덕션 전반에 걸친 일관된 캐릭터 생성을 위해, Stable Diffusion으로 캐릭터 이미지 10~20장에 대해 LoRA를 학습시킨 뒤 모든 이미지 생성에 그 LoRA를 사용하세요. 이는 프롬프트 묘사만으로 하는 것보다 훨씬 신뢰할 만한 캐릭터 정체성을 제공하며, AI 캐릭터 일관성 워크플로의 표준 기법입니다.
유형과 변형
- Stable Diffusion은 여러 주요 버전으로 공개되었습니다.
- SD 1.
- 4, SD 1.
- 5, SD 2.
- 0, SD 2.
- 1, SDXL(Stable Diffusion XL), Stable Diffusion 3입니다.
- 각 버전은 해상도, 프롬프트 준수도, 이미지 품질에서 개선을 가져왔습니다.
- 커뮤니티는 포토리얼리즘, 애니메이션, 콘셉트 아트, 그 외 많은 미학에 특화된 수천 개의 파인튜닝된 체크포인트를 만들어 냈습니다.
- LoRA 어댑터는 특정 캐릭터, 스타일, 피사체를 위한 경량 파인튜닝을 가능하게 합니다.
- ControlNet은 에지 맵, 뎁스 맵, 포즈 입력을 사용한 공간적 컨디셔닝을 더해 더 큰 구성 제어를 제공합니다.
Morphic에서 첫 장면을 만들어 볼까요?
Morphic 체험하기주요 활용 사례
Stable Diffusion은 콘셉트 아트와 비주얼 개발 에셋 생성, LoRA 학습을 통한 일관된 AI 캐릭터 제작, 배경 및 환경 이미지 제작, 러프 스케치나 레퍼런스 이미지의 img2img 정제, 이미지 편집과 확장을 위한 인페인팅과 아웃페인팅, 스토리보드 프레임 생성, 3D 및 합성 워크플로를 위한 텍스처와 에셋 제작, 그리고 커스텀 AI 이미지 파이프라인의 토대 레이어로 사용됩니다.
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.
FAQ
Stable Diffusion은 라텐트 디퓨전 프로세스를 사용해 텍스트 프롬프트로부터 이미지를 생성하는 오픈소스 AI 모델입니다. 2022년 Stability AI가 공개했으며 AI 이미지 생성에서 가장 널리 사용되는 토대 중 하나가 되었습니다.
네, Stable Diffusion 모델 가중치는 무료로 다운로드하고 사용할 수 있습니다. 로컬에서 실행하려면 적합한 GPU 하드웨어가 필요합니다. Stable Diffusion을 사용하는 많은 웹 기반 도구는 로컬 설정 없이 무료 또는 구독 기반 액세스를 제공합니다.
각 버전(SD 1.5, SD 2.1, SDXL, SD 3)은 이미지 품질, 해상도, 프롬프트 이해, 아키텍처 설계에서 개선을 제공합니다. SD 1.5는 방대한 커뮤니티 파인튜닝 라이브러리 덕분에 여전히 널리 사용되고, SDXL과 SD 3은 더 높은 해상도와 향상된 품질을 제공합니다.
LoRA(Low-Rank Adaptation)는 Stable Diffusion과 함께 사용되는 경량 파인튜닝 방법으로, 소규모 이미지 세트로 모델을 학습시켜 특정 캐릭터, 스타일, 사물을 일관되게 생성하도록 적응시킵니다. LoRA는 공유하고 베이스 모델에 적용할 수 있는 작은 파일입니다.
ControlNet은 Stable Diffusion의 확장으로, 에지 맵, 뎁스 맵, 포즈 스켈레톤, 그 외 구조화된 입력을 사용한 공간적 컨디셔닝을 더해, 크리에이터에게 생성된 이미지의 구성과 구조에 대한 훨씬 더 정밀한 제어를 제공합니다.
Stable Diffusion 자체는 주로 이미지 생성 모델이지만, AnimateDiff 같은 관련 프로젝트는 모션 모듈을 더한 Stable Diffusion 체크포인트를 사용해 짧은 애니메이션 클립을 생성합니다. Stable Video Diffusion 같은 전용 영상 생성 모델은 이 접근을 영상으로 확장합니다.