Question 1

DALL-E 2란 무엇입니까?

Accepted Answer

DALL-E 2는 2022년 4월에 출시된 OpenAI의 2세대 텍스트-이미지 모델입니다. 디퓨전 기반 아키텍처를 사용해 원본 DALL-E보다 더 높은 해상도의 이미지를 산출하며 인페인팅, 아웃페인팅, 이미지 변형 능력을 더합니다.

Question 2

DALL-E 2는 원본 DALL-E와 어떻게 다릅니까?

Accepted Answer

DALL-E 2는 트랜스포머 자기회귀 아키텍처에서 디퓨전 모델로 전환하여 더 높은 해상도에서 더 선명한 이미지를 산출합니다. 또한 원본이 제공하지 않았던 인페인팅과 아웃페인팅을 포함한 이미지 편집 능력을 더했습니다.

Question 3

DALL-E 2의 인페인팅이란 무엇입니까?

Accepted Answer

인페인팅은 사용자가 기존 이미지 안의 영역을 선택한 다음 그 영역을 무엇으로 교체할지 텍스트로 묘사할 수 있게 합니다. 모델은 이미지의 주변 스타일과 맥락에 맞추면서 선택된 영역을 채울 새 콘텐츠를 생성합니다.

Question 4

DALL-E 2의 아웃페인팅이란 무엇입니까?

Accepted Answer

아웃페인팅은 기존 이미지를 원래 캔버스 경계 너머로 확장하여, 원본 이미지의 스타일, 조명, 시각적 맥락을 확장된 영역으로 이어 가는 새 콘텐츠를 생성합니다.

Question 5

DALL-E 2는 어떤 해상도로 생성합니까?

Accepted Answer

DALL-E 2는 최대 해상도로 1024x1024 픽셀의 이미지를 생성하는데, 이는 더 낮은 해상도의 결과물을 산출했던 원본 DALL-E에 비해 상당한 향상입니다.

Question 6

DALL-E 2는 오늘날에도 사용됩니까?

Accepted Answer

DALL-E 2는 대부분의 생성 작업에서 DALL-E 3로 대체되었는데, DALL-E 3가 훨씬 더 나은 프롬프트 준수와 이미지 품질을 제공하기 때문입니다. 다만 DALL-E 2의 인페인팅과 아웃페인팅 능력은 특정 편집 워크플로를 위해 여전히 접근될 수 있습니다.

Question 7

DALL-E 2는 프롬프트 이해를 어떻게 처리합니까?

Accepted Answer

DALL-E 2는 언어 이해를 시각 콘텐츠 생성에 연결하는 CLIP 기반 텍스트-이미지 정렬 시스템을 사용합니다. 광범위한 프롬프트 유형을 처리하지만, 특히 복잡한 구성적 지시에서 DALL-E 3보다 덜 정밀한 프롬프트 준수를 보입니다.

Question 8

DALL-E 2는 어떤 안전 기능을 포함합니까?

Accepted Answer

DALL-E 2는 유해하거나 노골적이거나 침해적인 콘텐츠의 생성을 방지하는 콘텐츠 필터를 포함합니다. 특정 맥락에서 실제 인물의 얼굴 생성을 제한하고 오용을 방지하도록 설계된 필터를 적용하며, 이러한 보호 장치는 API 수준에서 시행됩니다.

DALL-E 2

DALL-E 2이란?