가이던스 스케일

가이던스 스케일이란?

가이던스 스케일은 AI가 텍스트 프롬프트를 얼마나 충실히 따르는지를 제어하는 설정입니다. 값을 높이면 모델이 설명을 더 엄격하게 따르고, 값을 낮추면 모델이 더 많은 창작적 자유를 발휘합니다.

한눈에 보기

다른 이름
CFG 스케일분류기 없는 가이던스 스케일프롬프트 강도(일부 인터페이스에서)
주요 용도
디퓨전 모델 생성에서 프롬프트 충실도 제어문자 그대로의 정확성과 미적 품질의 균형 맞추기다양한 창작 목표에 맞춘 모델 거동 조정
주로 쓰이는 도구
Stable diffusionMidjourneyAUTOMATIC1111 WebUIComfyUIRunwayAny diffusion-based generation platform
관련 용어
Diffusion modelPrompt engineeringNoise / denoisingSampling stepsLatent space

지금 만들어 볼까요?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.

다른 개념과의 비교

다른 개념과의 비교

Compared with related concepts

가이던스 스케일 대 샘플링 스텝: 가이던스 스케일은 프롬프트가 디노이징 과정의 각 단계에 얼마나 강하게 영향을 미치는지를 제어하여 텍스트에 설명된 내용에 대한 충실도에 영향을 줍니다. 샘플링 스텝은 모델이 전체적으로 몇 번의 디노이징 반복을 수행하는지를 제어하여 최종 출력의 디테일과 일관성에 영향을 줍니다. 두 매개변수는 상호작용합니다. 스텝이 많을수록 가이던스 스케일이 출력을 다듬을 기회가 더 많아지지만, 둘은 생성 과정의 근본적으로 다른 측면을 제어합니다.


프로 팁

프롬프트의 특정 요소, 즉 특정 객체, 배경 디테일, 구도 요소를 출력에 나타나게 할 수 없을 때는 다른 변경을 하기 전에 가이던스 스케일을 2~3단위 높여 보세요. 그 후 출력이 거칠거나 과채도로 보이면 해당 프롬프트와 모델 조합의 상한을 찾은 것이며, 문제는 가이던스 설정보다 프롬프트 표현이나 모델 역량에 있을 가능성이 더 큽니다.

유형과 변형

  • 디퓨전 모델마다 효과적인 가이던스 스케일 범위가 다릅니다.
  • Stable Diffusion 1.
  • 5 같은 모델은 일반적으로 7~12 범위에서 잘 작동하는 반면, SDXL이나 Flux 같은 최신 아키텍처는 더 낮은 값에서 더 잘 작동할 수 있습니다.
  • 일부 모델은 분류기 없는 가이던스를 변형된 형태로 사용하며, 예를 들어 이미지 토큰과 텍스트 토큰에 다르게 적용하는데, 이는 수치 범위가 비슷해 보이더라도 스케일 매개변수의 실제 거동을 바꿀 수 있습니다.
  • 일부 플랫폼은 수치 스케일을 설명적 프리셋으로 대체하여, 근본적인 기술 매개변수를 노출하지 않고도 가이던스 스케일 조정을 더 접근하기 쉽게 만듭니다.

Morphic에서 첫 장면을 만들어 볼까요?

Morphic 체험하기

주요 활용 사례

  • 창작자는 생성된 출력이 프롬프트에 설명된 특정 요소를 포함하지 못할 때 가이던스 스케일을 조정합니다.
  • 스케일을 높이면 이러한 요소가 더 일관되게 나타나는 경우가 많습니다.
  • 반대로 생성된 이미지가 거칠거나 과도하게 채도가 높거나 부자연스럽게 뻣뻣해 보일 때는 스케일을 낮추면 더 자연스러운 미적 품질이 흔히 회복됩니다.
  • 파인튜닝되거나 LoRA로 적응된 모델은 베이스 모델보다 더 낮은 가이던스 스케일이 필요할 수 있는데, 파인튜닝이 이미 모델의 사전 정보를 원하는 출력 영역으로 특화시켜 강한 프롬프트 유도의 필요를 줄였기 때문입니다.

지금 만들어 볼까요?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.

FAQ

AI 이미지 생성에서 가이던스 스케일이란 무엇인가요?

가이던스 스케일은 디퓨전 모델의 출력이 텍스트 프롬프트에 얼마나 충실하게 따르는지를 제어하는 파라미터입니다. 값이 높을수록 모델이 프롬프트를 더 엄격하게 따르고, 값이 낮을수록 모델이 자체 학습된 미적 감각에 의존할 더 많은 창작적 자유를 갖게 되어 시각적으로는 더 자연스럽지만 문자 그대로는 덜 정확한 결과를 만들 수 있습니다.

AI 이미지 생성에서 CFG는 무엇을 의미하나요?

CFG는 분류기 없는 가이던스(classifier-free guidance)를 의미하며, 디퓨전 모델에서 가이던스 스케일의 기반이 되는 기술적 메커니즘입니다. 이는 모델의 조건화된 출력(프롬프트를 따름)과 비조건화 출력(방향성 없이 생성) 사이의 차이를 증폭하는 방식으로 작동하여, 별도의 분류기 모델 없이도 생성을 프롬프트된 내용 쪽으로 유도합니다.

가이던스 스케일이 너무 높으면 어떻게 되나요?

가이던스 스케일 값이 매우 높으면 출력이 과채도, 시각적 거칠음, 인위적 선명함을 띠는 경향이 있으며, 흔히 burnt로 묘사되는 품질이 나타납니다. 모델이 각 프롬프트 요소를 자연스럽게 균형 잡지 못한 채 독립적으로 지나치게 헌신하여, 통합된 느낌이라기보다 하이퍼리얼하거나 플라스틱 같은 느낌의 이미지를 만드는 경우가 많습니다.

가이던스 스케일이 너무 낮으면 어떻게 되나요?

값이 매우 낮으면 모델이 프롬프트를 대체로 무시하고 자체 학습된 사전 정보를 기반으로 이미지를 생성하는데, 이는 미적으로는 매력적일 수 있으나 설명된 내용과 일치하지 않습니다. 프롬프트에서 요구한 특정 피사체, 객체, 구도 요소가 출력에서 빠지거나 모호하게 나타날 수 있습니다.

시작하기에 좋은 가이던스 스케일은 무엇인가요?

7에서 12 사이의 값이 대부분의 Stable Diffusion 기반 모델에 합리적인 시작점이며, Flux 같은 최신 아키텍처는 흔히 2~5 범위의 더 낮은 값에서 더 잘 작동합니다. 최적 값은 특정 모델, 프롬프트 복잡도, 원하는 미감에 따라 달라지므로, 사용 중인 모델의 효과적인 범위 안에서 실험하는 것이 가장 신뢰할 만한 접근입니다.

가이던스 스케일은 이미지뿐 아니라 영상 생성에도 영향을 주나요?

가이던스 스케일은 이미지 모델과 동일한 방식으로 영상 디퓨전 모델에도 적용되어, 생성된 영상이 각 디노이징 단계에서 텍스트 프롬프트를 얼마나 충실하게 따르는지를 제어합니다. 영상 생성에서 가이던스 스케일과 시간적 일관성 사이의 상호작용은 정지 이미지 작업보다 더 복잡할 수 있으며, 영상 모델마다 효과적인 가이던스 범위가 더 좁을 수 있습니다.

가이던스 스케일은 모든 AI 생성 도구에서 동일한가요?

근본 개념은 디퓨전 기반 모델 전반에 걸쳐 일관되지만, 효과적인 수치 범위, 기본값, 매개변수의 명칭은 도구와 모델 아키텍처에 따라 다릅니다. 한 모델에서 높은 가이던스 스케일로 읽히는 값이 다른 모델에서는 다르게 거동할 수 있으므로, 보편적인 규칙을 적용하기보다 사용 중인 모델의 구체적인 거동을 이해하는 것이 더 유용합니다.

가이던스 스케일로 나쁜 프롬프트를 고칠 수 있나요?

가이던스 스케일은 모델이 프롬프트를 얼마나 강하게 따르는지를 조절하지만, 불명확하거나 모순적이거나 모델의 역량을 벗어난 프롬프트를 보완할 수는 없습니다. 설명된 개념이 모델의 학습 데이터에 잘 표현되어 있지 않다면, 가이던스 스케일을 높여도 더 헌신적이지만 여전히 부정확한 해석을 강제할 뿐입니다. 프롬프트 자체를 개선하는 것이 가이던스 스케일만 조정하는 것보다 항상 더 효과적입니다.

Can't find what you are looking for?
Contact us and let us know.
bg