제로샷 러닝(Zero-Shot Learning)
제로샷 러닝(Zero-Shot Learning)이란?
제로샷 러닝은 모델이 구체적으로 학습된 적 없는 과제나 콘텐츠를 다루는 능력으로, 더 폭넓은 학습의 일반 지식을 한 번도 직접 보지 못한 새로운 상황에 적용합니다.
한눈에 보기
- 다른 이름
- Zero-shot generalisationZero-shot inferenceZero-shot capability
- 주요 용도
- 과제 특화 학습 예시 없이 새로운 과제 수행학습 데이터에 없는 개념 조합의 콘텐츠 생성모델의 일반화 능력의 폭 테스트AI 모델이 비일상적 프롬프트에서 성공하거나 실패하는 이유 이해
- Key features
- 해당 과제의 직접 학습 예시 없이 과제 수행더 폭넓은 학습 지식에서 새로운 시나리오로 일반화퓨샷 러닝, 파인튜닝과 대조됨실용적 능력이자 모델 품질의 척도
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.
다른 개념과의 비교
Compared with related concepts
제로샷 러닝은 모델 적응 스펙트럼의 지점들인 퓨샷 러닝, 파인튜닝과 대조하는 것이 가장 유용합니다. 제로샷 성능은 모델이 과제 특화 안내 없이 할 수 있는 것입니다. 퓨샷 성능은 프롬프트에 소수의 예시가 주어졌을 때 모델이 할 수 있는 것으로, 현재의 대규모 언어·생성 모델에서는 특정 과제에 대해 종종 제로샷보다 극적으로 낫습니다. 파인튜닝은 모델 가중치가 특정 데이터셋으로 업데이트된 후 모델이 할 수 있는 것으로, 학습 투자를 대가로 특정 과제나 도메인에 대한 최대 적응을 대표합니다. 실용적 생성 작업에서 대부분의 과제는 순수 제로샷과 퓨샷 영역 사이 어딘가에 놓이며, 프롬프트와 함께 시각적 또는 텍스트 레퍼런스 예시를 제공하면 결과물 품질이 크게 향상됩니다.
이렇게 생각해 보세요…
제로샷 러닝은 일본을 한 번도 방문한 적 없지만 일본에 대해 폭넓게 읽고, 많은 일본 영화를 보고, 언어를 공부한 사람에게 전통적인 료칸 인테리어를 묘사해 달라고 요청하는 것과 비슷합니다. 그는 피사체를 직접 경험한 적이 없지만, 폭넓은 노출이 쌓아 올린 광범위한 관련 지식에서 일반화해 그럴듯하고 종종 정확한 묘사를 만들어 낼 수 있습니다. 그 일반화의 품질은 배경 지식이 얼마나 풍부하고 상호 연결되어 있는지에 달려 있습니다. 깊고 다양한 일본 문화 노출을 가진 사람은 몇 가지 측면에 대한 피상적 지식을 가진 사람보다 더 정확히 일반화할 것입니다. AI 모델도 비슷하게 작동합니다. 학습의 폭과 깊이가 새로운 요청에 대한 제로샷 일반화의 품질을 결정합니다.
프로 팁
생성 모델이 비일상적이거나 매우 구체적인 프롬프트에 실망스러운 결과를 낼 때, 문제는 종종 요청이 모델의 효과적인 제로샷 일반화 범위 밖에 놓여 있다는 것입니다. 개념 조합이 너무 새롭거나 너무 구체적이어서 모델이 학습에서 정확히 보간할 수 없는 것입니다. 실용적 대응은 프롬프트를 분해하는 것입니다. 전체 비일상적 조합을 한 번에 요청하기보다, 그것을 익숙한 구성 요소로 나누어 따로 묘사하십시오. 가장 새로운 요소에는 시각 레퍼런스 이미지를 더하십시오. 스타일 방향이 매우 구체적이면 그것을 근사하는 예시 이미지를 제공하십시오. 제공하는 추가 정박점 하나하나가 요청을 순수 제로샷 일반화에서 더 안내된 추론으로 옮기며, 이는 보통 훨씬 더 나은 결과를 만들어 냅니다.
유형과 변형
- 제로샷 러닝은 서로 다른 AI 양식에 걸친 여러 뚜렷한 능력을 아우릅니다.
- 언어와 텍스트 생성에서 제로샷 능력은 모델이 구체적으로 학습되지 않은 과제 유형에 대한 지시를 따르고, 텍스트를 새로운 범주로 분류하며, 학습 데이터에 직접 존재하지 않는 주제에 대한 질문에 답할 수 있게 합니다.
- 이미지 생성에서 제로샷 능력은 모델이 학습 예시로 직접 표현되지 않은 개념 조합, 시각 스타일, 피사체 묘사에 대해 그럴듯한 이미지를 생성할 수 있게 합니다.
- 영상 생성에서 제로샷 일반화는 관련 학습 자료로부터의 외삽을 통해 일관된 결과를 내는 카메라 무빙, 피사체, 분위기 조건의 새로운 조합으로 확장됩니다.
- 퓨샷 러닝은 인접한 능력으로, 추론 시점에 프롬프트에 제공된 소수의 예시가 모델의 행동을 안내해, 파인튜닝의 비용 없이 제로샷만으로보다 더 나은 과제 정렬을 달성합니다.
Morphic에서 첫 장면을 만들어 볼까요?
Morphic 체험하기주요 활용 사례
- 제로샷 러닝은 요청된 과제나 콘텐츠가 새롭거나 비일상적이거나 매우 구체적인 생성 AI 모델과의 모든 상호작용에 관련됩니다.
- 명명된 작가나 운동에 대응하지 않는 시각 스타일을 이미지 생성 모델에 프롬프트하는 것은, 묘사를 일관된 미감 결과로 번역하기 위해 제로샷 일반화에 의존합니다.
- 언어 모델에 비일상적 포맷이나 예상치 못한 시점에서 개념을 설명하도록 요청하는 것은 제로샷 과제 일반화에 의존합니다.
- 직접적 학습 유사물이 없는 방식으로 결합된 생물, 환경, 행동, 스타일 등 매우 구체적이고 비일상적인 피사체 조합의 영상을 생성하는 것은, 일관된 결과를 내기 위해 제로샷 일반화에 의존합니다.
- 요청이 언제 모델의 제로샷 능력 안에 들고 언제 더 많은 안내나 분해를 요구하는지를 이해하는 것은 효과적인 AI 제작을 위한 실용적 기술입니다.
지금 만들어 볼까요?
장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요
단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.
FAQ
제로샷 러닝은 추론 시점에 어떤 과제 특화 예시도 제공되지 않은 채, 전적으로 학습으로부터의 일반화에 의존해 과제를 수행하거나 콘텐츠를 생성하는 모델의 능력입니다. 퓨샷 러닝은 추론 시점에 요청과 함께 소수의 예시( 보통 한 개에서 다섯 개 사이 )를 제공해, 원하는 결과물이 어떤 모습인지를 모델에 시연하고, 처음부터 일반화하기보다 제공된 예시에 반응을 패턴 매칭하게 합니다. 퓨샷 성능은 학습만으로 일반화하기 어려운 특정 포맷이나 스타일을 가진 과제에서 보통 제로샷보다 낫습니다.
제로샷 러닝은 AI 생성 모델을 유연하고 폭넓게 적용 가능하게 만드는 기저 능력입니다. 생성 모델이 직접 만들도록 학습된 적 없는 개념과 조합에 대한 프롬프트에 의미 있게 반응하게 하는 것이 바로 이것입니다. 제로샷 성능의 품질은 모델이 여전히 유용한 결과를 내면서 익숙한 영역에서 얼마나 멀리 밀려날 수 있는지를 결정합니다. 제로샷 일반화가 무너지는 곳( 매우 새롭거나, 모순되거나, 충분히 명시되지 않은 프롬프트 )에서는, 출력 품질이 요청된 새로움으로 성공적으로 외삽하기보다 학습 분포 전반에 걸쳐 평균을 내는 모델을 반영하는 일반적이거나 일관성 없는 결과로 저하됩니다.
예. 프롬프트의 구체성과 맥락적 정박점의 제공은 모델이 새로운 요청에 얼마나 잘 일반화하는지에 크게 영향을 줍니다. 비일상적 개념 조합을 익숙한 구성 요소로 분해하기, 가장 새로운 측면에 시각적 또는 텍스트 레퍼런스 예시 제공하기, 그리고 원하는 결과물의 성격을 모델의 학습이 마주했을 가능성이 높은 용어로 명시적으로 묘사하기는 모두 모델의 제로샷 능력 가장자리에 있는 과제의 결과를 개선합니다. 목표는 모델이 너무 적은 안내로부터 맹목적으로 외삽하기보다 새로운 목표로 보간할 수 있도록 충분한 익숙한 레퍼런스 지점을 제공하는 것입니다.
제로샷 실패는 요청된 개념, 스타일, 또는 과제 조합이 모델 학습의 효과적인 일반화 범위 밖에 놓일 때 일어납니다. 모델이 요청된 새로움으로 정확히 외삽하기에 학습 데이터에 충분한 관련 패턴이 없을 때입니다. 이는 개념이 학습 데이터에서 진정으로 드물기 때문에, 개념 조합이 모델이 해소할 수 없는 모순 신호를 만들기 때문에, 또는 과제가 모델 아키텍처가 지원하지 않는 정도의 새로운 추론을 요구하기 때문에 일어날 수 있습니다. 제로샷이 실패하면, 일반적인 결과는 일반적이거나, 혼란스럽거나, 요청의 구체적 의도된 의미보다 표면 수준 용어의 가장 흔한 연상으로 기본 처리되는 출력입니다.
프롬프트 엔지니어링은 제로샷과 퓨샷 능력의 제약 안에서 유용한 모델 성능을 극대화하는 실용적 규율로 이해할 수 있습니다. 프롬프트 엔지니어는 모델의 일반화 역량과 함께 일합니다. 모델이 성공적으로 일반화할 수 있는 용어로 요청을 구성하려 하고, 제로샷만으로 불충분할 때 예시를 제공하며, 모호성을 줄이고 모델의 추론을 의도된 결과로 안내하도록 프롬프트를 구조화합니다. 제로샷 러닝을 이론적으로 이해하면 특정 프롬프팅 전략이 왜 통하고 다른 것은 왜 실패하는지를 설명함으로써 더 나은 프롬프트 엔지니어링 실무를 뒷받침합니다.
제로샷 능력은 모델 크기와 학습 데이터 다양성과 함께 강하게 확장됩니다. 더 다양한 데이터로 학습된 더 큰 모델은 일반적으로 더 나은 제로샷 일반화를 보입니다. 더 작거나 더 특화된 모델은 종종 특정 학습 도메인 밖에서 제로샷 성능이 떨어져, 새로운 입력에서 잘 수행하려면 과제 특화 예시나 파인튜닝이 필요합니다. 매우 큰 사전 학습 모델의 발전( GPT 규모 언어 모델, 이미지 생성을 위한 대규모 디퓨전 모델 )은 더 작은 모델이 접근할 수 없는 실용적 수준의 제로샷 능력을 가져왔으며, 이는 대규모 파운데이션 모델이 생성 AI 애플리케이션에서 지배적 접근이 된 한 이유입니다.
AI 영상 생성에서 제로샷 능력은 라벨링된 학습 예시로 직접 표현되지 않은 피사체, 스타일, 카메라 무빙, 분위기 조건에 대한 프롬프트 묘사를 모델이 얼마나 잘 해석할 수 있는지를 결정합니다. 강한 제로샷 영상 생성 능력을 가진 모델은 비일상적 개념 조합, 기술 용어로 묘사된 특정 카메라 기법, 또는 명명된 시각 레퍼런스가 아닌 묘사적 언어로 명시된 분위기적 품질에 대해 그럴듯한 푸티지를 만들어 낼 수 있습니다. 제로샷 영상 생성 역량이 초과되는 곳에서는, 모델이 구체적으로 요청된 결과물보다 흔한 학습 예시를 근사하는 일반적 카메라 무빙, 평균화된 시각 스타일, 피사체 표현으로 기본 처리하는 경향이 있습니다.
최적의 접근은 요청된 결과물이 얼마나 새롭거나 구체적인지에 달려 있습니다. 모델 학습 데이터에 잘 표현된 개념과 스타일( 명명된 시각 스타일, 확립된 촬영 기법, 명확히 묘사된 피사체 )에는 제로샷 생성이 보통 좋은 결과를 내며 레퍼런스 이미지는 미미한 개선만 더합니다. 모델의 학습 분포에 맞서는 매우 구체적이거나 비일상적이거나 새로운 개념에는, 레퍼런스 이미지가 모델의 추론을 일반적 평균이 아니라 의도된 목표로 안내하는 값진 정박점이 됩니다. 실무에서는 생성의 가장 구체적이고 새로운 요소에 레퍼런스 이미지를 제공하면서 더 익숙한 요소에는 제로샷 능력에 의존하는 것이 가장 효율적인 접근입니다.