Glossaryarrow
추론
추론

Inference(추론)는 학습된 AI 모델을 사용해 새 입력으로부터 출력을 생성하는 과정으로, 모델이 데이터에서 패턴을 학습하는 학습 단계와 구별됩니다. 추론 시 모델은 사용자가 제공한 프롬프트나 조건 입력을 바탕으로 이미지, 영상, 기타 콘텐츠를 생성합니다.

추론은 고해상도 이미지나 영상을 생성하는 대형 모델에서 특히 연산 집약적이며, 상당한 GPU 연산력과 메모리가 필요합니다. 추론 속도는 사용자가 생성 완료를 기다리는 시간을 결정하며, 실시간·대량 생성이 가능하도록 추론 성능 최적화가 중요한 과제입니다. 모델 증류, 양자화, 전용 추론 엔진 등으로 연산 요구를 줄이고 생성 시간을 단축합니다.

추론을 학습과 구분해 이해하면 제작자는 모델마다 속도가 다른 이유, 일부 수정이 생성 속도에 미치는 영향, 연산 자원이 실제 워크플로에 미치는 영향을 파악할 수 있습니다. Morphic처럼 여러 모델을 제공하는 플랫폼에서는 추론 비용과 속도가 크레딧 배분과 모델 선택에 영향을 줍니다.

Can't find what you are looking for?
Contact us and let us know.
bg