Question 1

제로샷과 퓨샷 러닝의 차이는 무엇인가요?

Accepted Answer

제로샷 러닝은 추론 시점에 어떤 과제 특화 예시도 제공되지 않은 채, 전적으로 학습으로부터의 일반화에 의존해 과제를 수행하거나 콘텐츠를 생성하는 모델의 능력입니다. 퓨샷 러닝은 추론 시점에 요청과 함께 소수의 예시( 보통 한 개에서 다섯 개 사이 )를 제공해, 원하는 결과물이 어떤 모습인지를 모델에 시연하고, 처음부터 일반화하기보다 제공된 예시에 반응을 패턴 매칭하게 합니다. 퓨샷 성능은 학습만으로 일반화하기 어려운 특정 포맷이나 스타일을 가진 과제에서 보통 제로샷보다 낫습니다.

Question 2

제로샷 러닝은 AI 생성 품질에 어떻게 영향을 주나요?

Accepted Answer

제로샷 러닝은 AI 생성 모델을 유연하고 폭넓게 적용 가능하게 만드는 기저 능력입니다. 생성 모델이 직접 만들도록 학습된 적 없는 개념과 조합에 대한 프롬프트에 의미 있게 반응하게 하는 것이 바로 이것입니다. 제로샷 성능의 품질은 모델이 여전히 유용한 결과를 내면서 익숙한 영역에서 얼마나 멀리 밀려날 수 있는지를 결정합니다. 제로샷 일반화가 무너지는 곳( 매우 새롭거나, 모순되거나, 충분히 명시되지 않은 프롬프트 )에서는, 출력 품질이 요청된 새로움으로 성공적으로 외삽하기보다 학습 분포 전반에 걸쳐 평균을 내는 모델을 반영하는 일반적이거나 일관성 없는 결과로 저하됩니다.

Question 3

더 나은 프롬프팅으로 제로샷 성능을 개선할 수 있나요?

Accepted Answer

예. 프롬프트의 구체성과 맥락적 정박점의 제공은 모델이 새로운 요청에 얼마나 잘 일반화하는지에 크게 영향을 줍니다. 비일상적 개념 조합을 익숙한 구성 요소로 분해하기, 가장 새로운 측면에 시각적 또는 텍스트 레퍼런스 예시 제공하기, 그리고 원하는 결과물의 성격을 모델의 학습이 마주했을 가능성이 높은 용어로 명시적으로 묘사하기는 모두 모델의 제로샷 능력 가장자리에 있는 과제의 결과를 개선합니다. 목표는 모델이 너무 적은 안내로부터 맹목적으로 외삽하기보다 새로운 목표로 보간할 수 있도록 충분한 익숙한 레퍼런스 지점을 제공하는 것입니다.

Question 4

무엇이 모델을 제로샷 과제에서 실패하게 만드나요?

Accepted Answer

제로샷 실패는 요청된 개념, 스타일, 또는 과제 조합이 모델 학습의 효과적인 일반화 범위 밖에 놓일 때 일어납니다. 모델이 요청된 새로움으로 정확히 외삽하기에 학습 데이터에 충분한 관련 패턴이 없을 때입니다. 이는 개념이 학습 데이터에서 진정으로 드물기 때문에, 개념 조합이 모델이 해소할 수 없는 모순 신호를 만들기 때문에, 또는 과제가 모델 아키텍처가 지원하지 않는 정도의 새로운 추론을 요구하기 때문에 일어날 수 있습니다. 제로샷이 실패하면, 일반적인 결과는 일반적이거나, 혼란스럽거나, 요청의 구체적 의도된 의미보다 표면 수준 용어의 가장 흔한 연상으로 기본 처리되는 출력입니다.

Question 5

제로샷 러닝은 프롬프트 엔지니어링과 어떻게 관련되나요?

Accepted Answer

프롬프트 엔지니어링은 제로샷과 퓨샷 능력의 제약 안에서 유용한 모델 성능을 극대화하는 실용적 규율로 이해할 수 있습니다. 프롬프트 엔지니어는 모델의 일반화 역량과 함께 일합니다. 모델이 성공적으로 일반화할 수 있는 용어로 요청을 구성하려 하고, 제로샷만으로 불충분할 때 예시를 제공하며, 모호성을 줄이고 모델의 추론을 의도된 결과로 안내하도록 프롬프트를 구조화합니다. 제로샷 러닝을 이론적으로 이해하면 특정 프롬프팅 전략이 왜 통하고 다른 것은 왜 실패하는지를 설명함으로써 더 나은 프롬프트 엔지니어링 실무를 뒷받침합니다.

Question 6

제로샷 러닝은 대규모 AI 모델에만 고유한가요?

Accepted Answer

제로샷 능력은 모델 크기와 학습 데이터 다양성과 함께 강하게 확장됩니다. 더 다양한 데이터로 학습된 더 큰 모델은 일반적으로 더 나은 제로샷 일반화를 보입니다. 더 작거나 더 특화된 모델은 종종 특정 학습 도메인 밖에서 제로샷 성능이 떨어져, 새로운 입력에서 잘 수행하려면 과제 특화 예시나 파인튜닝이 필요합니다. 매우 큰 사전 학습 모델의 발전( GPT 규모 언어 모델, 이미지 생성을 위한 대규모 디퓨전 모델 )은 더 작은 모델이 접근할 수 없는 실용적 수준의 제로샷 능력을 가져왔으며, 이는 대규모 파운데이션 모델이 생성 AI 애플리케이션에서 지배적 접근이 된 한 이유입니다.

Question 7

제로샷 러닝은 AI 영상 생성에 구체적으로 어떻게 적용되나요?

Accepted Answer

AI 영상 생성에서 제로샷 능력은 라벨링된 학습 예시로 직접 표현되지 않은 피사체, 스타일, 카메라 무빙, 분위기 조건에 대한 프롬프트 묘사를 모델이 얼마나 잘 해석할 수 있는지를 결정합니다. 강한 제로샷 영상 생성 능력을 가진 모델은 비일상적 개념 조합, 기술 용어로 묘사된 특정 카메라 기법, 또는 명명된 시각 레퍼런스가 아닌 묘사적 언어로 명시된 분위기적 품질에 대해 그럴듯한 푸티지를 만들어 낼 수 있습니다. 제로샷 영상 생성 역량이 초과되는 곳에서는, 모델이 구체적으로 요청된 결과물보다 흔한 학습 예시를 근사하는 일반적 카메라 무빙, 평균화된 시각 스타일, 피사체 표현으로 기본 처리하는 경향이 있습니다.

Question 8

제로샷 능력에 의존해야 하나요, 아니면 항상 레퍼런스 이미지를 제공해야 하나요?

Accepted Answer

최적의 접근은 요청된 결과물이 얼마나 새롭거나 구체적인지에 달려 있습니다. 모델 학습 데이터에 잘 표현된 개념과 스타일( 명명된 시각 스타일, 확립된 촬영 기법, 명확히 묘사된 피사체 )에는 제로샷 생성이 보통 좋은 결과를 내며 레퍼런스 이미지는 미미한 개선만 더합니다. 모델의 학습 분포에 맞서는 매우 구체적이거나 비일상적이거나 새로운 개념에는, 레퍼런스 이미지가 모델의 추론을 일반적 평균이 아니라 의도된 목표로 안내하는 값진 정박점이 됩니다. 실무에서는 생성의 가장 구체적이고 새로운 요소에 레퍼런스 이미지를 제공하면서 더 익숙한 요소에는 제로샷 능력에 의존하는 것이 가장 효율적인 접근입니다.

제로샷 러닝(Zero-Shot Learning)

제로샷 러닝(Zero-Shot Learning)이란?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

유형과 변형

Morphic에서 첫 장면을 만들어 볼까요?

주요 활용 사례

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

FAQ