인퍼런스(Inference)

인퍼런스(Inference)이란?

인퍼런스는 '생성' 버튼을 클릭할 때 일어나는 일입니다. AI가 학습 과정에서 배운 모든 것을 적용하여, 프롬프트를 바탕으로 새로운 이미지나 영상을 만들어 냅니다.

한눈에 보기

다른 이름
모델 인퍼런스생성(Generation)포워드 패스(forward pass)
주요 용도
프롬프트로부터 이미지와 영상 생성하기AI 모델을 실행해 새로운 결과물 만들기학습된 모델 지식을 사용자 입력에 적용하기
주로 쓰이는 도구
Stable diffusionMidjourneyRunwayKlingAny AI generation platform
관련 용어
Diffusion modelsSamplingCFG scaleLatent spaceModel distillation
How it works in simple terms
학습된 AI 모델은 학습된 패턴과 파라미터를 담고 있습니다. 인퍼런스 과정에서 모델은 입력( 텍스트 프롬프트, 참조 이미지, 또는 기타 조건부 입력 )을 받아 그 학습된 파라미터를 통과시키는 단일 포워드 패스를 실행하여, 학습 데이터의 패턴과 사용자가 제공한 구체적인 안내를 모두 반영한 출력을 만들어 냅니다.
Where you encounter this
인퍼런스는 AI 도구로 콘텐츠를 생성할 때마다 일어나는 일입니다. 프롬프트를 제출한 뒤 결과를 받기까지의 대기 시간이 인퍼런스 시간입니다. AI 플랫폼의 생성당 과금 정책은 인퍼런스 실행의 계산 비용을 반영합니다. 플랫폼이 초안 품질 대 고품질, 또는 서로 다른 모델 크기 같은 속도 옵션을 제공할 때, 그것은 서로 다른 인퍼런스 구성을 제공하는 것입니다.

지금 만들어 볼까요?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.

다른 개념과의 비교

다른 개념과의 비교

Compared with related concepts

인퍼런스는 학습의 운영상 대응물입니다. 학습은 수백만 개의 예시에 걸쳐 모델의 역량을 구축하는 계산적으로 방대한 일회성 과정이고, 인퍼런스는 학습된 모델을 실행해 개별 결과물을 만들어 내는 상대적으로 작은 계산입니다. 한 번 학습된 모델은 이후 수많은 인퍼런스 실행에 사용할 수 있으며, 대기업이 학습에 막대하게 투자하면서도 생성당 비교적 낮은 비용으로 인퍼런스를 제공할 수 있는 이유가 여기에 있습니다.


프로 팁

느린 생성 시간을 겪거나 비용을 줄이고 싶다면, 인퍼런스 스텝이나 품질 수준을 제어하는 설정을 찾아보세요. 기본값에서 스텝을 줄이면 콘셉트 탐색에 적합한, 더 빠르고 충실도가 낮은 결과물을 만들 수 있는 반면, 스텝과 해상도를 최대화하면 더 많은 연산을 사용해 최종 제작용 최고 품질 결과를 만들어 냅니다.

유형과 변형

  • 인퍼런스 구성은 사용되는 샘플링 스텝 수(스텝이 많을수록 일반적으로 품질은 높아지지만 시간이 더 걸림), 적용되는 가이던스 스케일(모델이 프롬프트를 얼마나 밀접하게 따르는지), 요청된 이미지 해상도, 그리고 기저 모델 아키텍처에 따라 달라집니다.
  • 배치 인퍼런스는 여러 생성을 동시에 실행하여 처리량을 높입니다.
  • 실시간 인퍼런스는 품질보다 속도에 최적화하여, 인터랙티브 응용을 위한 거의 즉각적인 생성을 가능하게 합니다.

Morphic에서 첫 장면을 만들어 볼까요?

Morphic 체험하기

주요 활용 사례

  • 인퍼런스는 모든 AI 생성 워크플로의 핵심입니다.
  • 프롬프트로부터 이미지를 생성하거나, 텍스트나 참조 이미지로 영상을 만들거나, 스타일 트랜스퍼를 실행하거나, 인페인팅을 수행하거나, 이미지를 업스케일하거나, AI 모델로 새로운 콘텐츠를 만들어 낼 때 일어나는 일입니다.
  • 인퍼런스를 이해하면 크리에이터가 생성 비용을 관리하고, 속도와 품질의 트레이드오프를 해석하며, 작업별로 어떤 모델과 설정을 사용할지에 대해 정보에 입각한 선택을 하는 데 도움이 됩니다.

지금 만들어 볼까요?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

단순하고 투명한 요금제, 속도 제한 없음, 무한한 Canvas로 창의력을 극대화하는 올인원 AI 크리에이티브 플랫폼.

FAQ

AI 생성 맥락에서 인퍼런스란 무엇인가요?

인퍼런스는 학습된 AI 모델을 실행하여 프롬프트나 참조 이미지 같은 사용자 입력으로부터 새로운 결과물( 이미지, 영상, 텍스트, 또는 기타 콘텐츠 )을 생성하는 과정입니다. 학습에 뒤따르는 운영 단계이며, 크리에이터가 생성을 요청할 때 실제로 일어나는 일을 가리킵니다.

인퍼런스는 학습과 어떻게 다른가요?

학습은 모델을 대규모 데이터셋에 노출하고 여러 반복에 걸쳐 파라미터를 조정하여 역량을 구축하는 과정으로, 계산적으로 방대한 일회성 과정입니다. 인퍼런스는 이미 학습된 모델을 사용해 새로운 결과물을 생성하는 과정으로, 상대적으로 계산 부담은 덜하지만 대형 모델의 경우 여전히 상당한 GPU 자원을 필요로 합니다.

인퍼런스는 왜 시간이 걸리나요?

인퍼런스 시간은 모델이 수행하는 처리 스텝 수, 출력 해상도, 그리고 모델 자체의 크기에 따라 결정됩니다. 여러 디노이징 스텝에 걸쳐 노이즈를 반복적으로 정제하는 디퓨전 모델은, 각 스텝마다 전체 모델 포워드 패스를 실행해야 하므로 특히 계산 집약적입니다. 이 과정은 생성 한 번당 수십 번에서 수백 번 반복되어야 합니다.

인퍼런스 속도에 영향을 미치는 요인은 무엇인가요?

주요 요인은 모델 크기(더 큰 모델은 스텝당 더 많은 연산을 요구함), 디노이징 스텝 수(스텝이 많을수록 품질은 좋아지지만 생성 시간이 길어짐), 출력 해상도(더 높은 해상도는 더 많은 메모리와 연산을 요구함), 그리고 사용 가능한 하드웨어(더 좋은 GPU는 인퍼런스 시간을 크게 단축함)입니다.

AI 생성 플랫폼에서 인퍼런스 비용은 어떻게 작동하나요?

대부분의 플랫폼은 인퍼런스 실행의 계산 비용을 기준으로 생성당 과금하며, 이는 모델 품질, 출력 해상도, 영상의 경우 생성 길이에 따라 달라집니다. 출력 품질이 높은 프리미엄 모델은 인퍼런스 과정에서 더 많은 연산을 소비하므로 일반적으로 생성당 비용이 더 높습니다.

모델 디스틸레이션이란 무엇이며 인퍼런스와 어떤 관련이 있나요?

모델 디스틸레이션은 더 크고 역량 있는 모델의 동작을 근사하는, 더 작고 빠른 모델을 만드는 기법입니다. 디스틸된 모델은 원본 품질의 대부분을 유지하려 하면서도 인퍼런스를 훨씬 더 빠르고 저렴하게 실행합니다. 많은 플랫폼이 최대 품질보다 속도가 더 중요한 사용 사례를 위해 디스틸된 모델 변형을 제공합니다.

사용자가 인퍼런스 품질을 제어할 수 있나요?

그렇습니다. 대부분의 플랫폼에서 사용자는 샘플링 스텝 수, 가이던스 스케일, 샘플러 선택 같은 파라미터를 통해 인퍼런스 품질을 제어할 수 있습니다. 스텝이 많을수록 일반적으로 생성 시간은 길어지지만 품질은 높아집니다. 일부 플랫폼은 이러한 제어를 단순한 품질 프리셋( 초안, 표준, 고품질 )으로 추상화하여, 기저 인퍼런스 설정을 자동으로 조정합니다.

'실시간 인퍼런스'란 무엇을 의미하나요?

실시간 인퍼런스는 인터랙티브 응용에 충분할 만큼, 경우에 따라서는 거의 즉각적으로 결과물을 만들어 내도록 최적화된 구성을 가리킵니다. 실시간 인퍼런스를 달성하려면 일반적으로 더 작고 디스틸된 모델을 사용하고 출력 해상도나 품질을 낮춰야 하며, 이는 최종 제작보다는 실시간 미리보기, 인터랙티브 경험, 빠른 반복 작업에 적합합니다.

Can't find what you are looking for?
Contact us and let us know.
bg