Imagen (Google)
Imagen은 Google Research가 개발한 Google의 텍스트-투-이미지 AI 생성 모델로, 소비자용 이미지 합성 기술에 회사가 진입한 것을 나타냅니다. 모델은 대규모 언어 모델 기반과 디퓨전 기반 이미지 생성을 결합해 강한 프롬프트 이해와 사진적 출력 품질을 강조합니다.
Imagen은 처음에 Google의 생성 AI 역량을 보여 주는 연구 데모로 공개되었으며, 복잡하고 상세한 프롬프트를 정확히 해석하고 설득력 있는 조명·재질·구도의 사진적 이미지를 만드는 데 특히 중점을 두었습니다. 모델은 처음 소개될 때 프롬프트 준수 벤치마크와 이미지 품질 지표에서 최신 수준 성능을 보였으며 DALL-E 2, Stable Diffusion 같은 동시대 모델과 직접 경쟁했습니다.
Google은 안전과 책임 있는 배포에 대한 우려를 이유로 이미지 생성 기술의 광범위한 공개에 일부 경쟁사보다 신중했지만, Imagen은 해당 영역에서 회사의 기술 역량을 나타내며 제품 생태계 전반의 Google 생성 AI 제품 후속 개발에 영향을 미쳤습니다.