Question 1

AI 이미지 생성에서 FLUX란 무엇인가요?

Accepted Answer

FLUX는 Black Forest Labs가 개발한 오픈소스 AI 이미지 생성 모델로, 2024년에 Stable Diffusion의 차세대 대안으로 공개되었습니다. 트랜스포머 기반 아키텍처를 사용하며, 강한 프롬프트 준수, 높은 이미지 품질, 이미지 내 정확한 텍스트 렌더링, 신뢰할 수 있는 해부학적 정확성으로 주목받습니다. 모두 이전 오픈소스 모델이 상당한 한계를 보였던 영역입니다.

Question 2

FLUX는 누가 만들었나요?

Accepted Answer

FLUX는 Black Forest Labs가 개발했으며, 이 회사는 이전에 Stability AI에서 Stable Diffusion 개발의 핵심이었던 여러 주요 연구자가 설립했습니다. 이 팀은 오픈소스 디퓨전 모델 연구 경험을 FLUX에 가져와, Stable Diffusion에서 쓰인 U-Net 백본이 아니라 새로운 트랜스포머 기반 아키텍처 위에 구축했습니다.

Question 3

FLUX의 여러 모델 변형은 무엇인가요?

Accepted Answer

FLUX는 서로 다른 사용 사례에 최적화된 모델 계열로 출시됩니다. FLUX.1 Pro는 전문 제작용 최고 품질 상업 변형입니다. FLUX.1 Dev는 개발자 실험과 맞춤 애플리케이션 구축을 위해 개방되어 있습니다. FLUX.1 Schnell은 빠른 프로토타이핑과 반복 작업을 위해 속도 최적화되어 있습니다. FLUX 2와 FLUX Kontext는 추가 역량 개선을 더한 후속 릴리스입니다.

Question 4

FLUX는 Stable Diffusion과 어떻게 비교되나요?

Accepted Answer

FLUX는 Stable Diffusion의 U-Net 백본에 비해 더 새로운 트랜스포머 기반 아키텍처를 사용하며, 일반적으로 여러 요소가 있는 복잡한 프롬프트에서 더 강한 결과를 만들고, 이미지 내 텍스트 렌더링을 더 잘 처리하며, 더 정확한 인체 해부를 유지합니다. Stable Diffusion은 더 긴 릴리스 역사에 걸쳐 쌓인 기존 파인튜닝 모델과 커뮤니티 도구의 더 큰 라이브러리를 갖췄습니다. 둘 다 오픈소스이며 겹치는 연구팀의 참여로 개발되었습니다.

Question 5

FLUX는 이미지 안에 텍스트를 생성할 수 있나요?

Accepted Answer

생성 이미지 내 텍스트 렌더링은 FLUX가 이전 오픈소스 모델에 비해 돋보이는 개선 중 하나입니다. 프롬프트에 텍스트 내용을 명확히 지정할 때(보통 원하는 텍스트를 설명 안에 따옴표로 넣어), FLUX는 생성 이미지 안에 읽을 수 있고 일관된 텍스트를 만들 수 있는데, 이는 Stable Diffusion 같은 모델의 상당한 약점이었습니다.

Question 6

FLUX는 무료로 사용할 수 있나요?

Accepted Answer

FLUX 모델의 이용 가능성은 특정 변형에 따라 다릅니다. FLUX.1 Dev와 FLUX.1 Schnell은 개발자 실험과 개인 사용에 접근할 수 있게 하는 라이선스로 출시됩니다. FLUX.1 Pro는 상업 API를 통해 이용할 수 있습니다. 변형마다 조건이 다르므로, 상업 제품이나 애플리케이션을 구축하기 전에 각 모델에 대한 Black Forest Labs의 최신 라이선스 문서를 검토하는 것이 좋습니다.

Question 7

FLUX를 파인튜닝할 수 있나요?

Accepted Answer

FLUX의 Dev 변형은 파인튜닝을 지원하며, 오픈소스 커뮤니티는 창작자와 개발자가 FLUX 기본 모델 위에 특정 스타일, 캐릭터 또는 시각 도메인을 위한 맞춤 모델을 학습할 수 있는 LoRA 학습 파이프라인을 개발했습니다. 파인튜닝된 FLUX 모델은 Hugging Face와 Civitai 같은 플랫폼에서 널리 공유되어, 기본 모델 너머의 전문화된 생성 역량 라이브러리를 확장합니다.

Question 8

FLUX를 로컬에서 실행하려면 어떤 하드웨어가 필요한가요?

Accepted Answer

FLUX를 로컬에서 실행하려면 충분한 VRAM을 갖춘 상당히 유능한 GPU가 필요합니다. FLUX.1 Dev와 Schnell 모델은 표준 해상도 생성에 보통 최소 8GB의 VRAM이 필요하며, 12GB 이상이면 더 여유로운 여유 공간을 제공합니다. Schnell 변형의 속도 최적화는 중간 사양 하드웨어에서 더 실용적으로 만듭니다. 출력 품질을 일부 희생하는 대신 메모리 요구량을 줄이는 양자화 버전도 커뮤니티에서 개발되었습니다.

FLUX

FLUX이란?

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

유형과 변형

Morphic에서 첫 장면을 만들어 볼까요?

주요 활용 사례

장면을 연출하고, 캐릭터를 디자인하고, 한 편의 영화까지 완성하세요

FAQ