노이즈 / 디노이징
AI 이미지·영상 생성 맥락에서 Noise(노이즈)는 디퓨전 모델이 생성의 출발점으로 쓰는 무작위 시각 정보—필름의 그레인이나 튜닝되지 않은 TV의 스태틱과 비슷한 픽셀 수준의 무작위성—를 말합니다. Denoising(디노이징)은 이 모델들이 학습된 정제 단계 연속을 통해 그 무작위 노이즈를 일관되고 구조된 이미지로 바꾸는 핵심 과정입니다.
디퓨전 모델은 이미지에 노이즈를 더하는 과정을 역으로 학습하는 방식으로 동작합니다. 학습 시 모델은 점점 더 노이즈가 더해져 순수 무작위가 될 때까지의 이미지를 보며, 이 열화의 각 단계를 예측하고 역으로 만드는 것을 학습합니다. 생성 시 모델은 무작위 노이즈에서 시작해 텍스트 프롬프트나 다른 조건 정보에 이끌려 학습된 디노이징 과정을 반복 적용하며, 노이즈를 점진적으로 일관된 이미지나 영상 프레임으로 바꿉니다. 생성 동안 수행하는 디노이징 스텝 수가 출력의 품질·일관성에 영향을 주며, 스텝이 많을수록 일반적으로 품질이 높아지고 생성 시간이 길어집니다. 이 과정 때문에 이 유형의 생성 모델을 디퓨전 모델이라 부릅니다.
노이즈-투-이미지 생성 과정은 제작자에게 실용적 함의가 있습니다. 시작 노이즈 상태는 종종 시드라 불리며, 같은 시드에 같은 프롬프트·설정을 쓰면 같거나 매우 비슷한 출력이 나와 재현성이 생깁니다. 다른 설정은 고정하고 시드만 바꾸면 같은 프롬프트의 다른 해석을 탐색할 수 있어, 기본 창작 방향을 바꾸지 않고 최선의 버전을 찾는 유용한 기법입니다.