Gemini Omni
Google DeepMind 제공
Google 최초의 any-to-any AI 모델. 텍스트·이미지·오디오·영상을 입력하고, 텍스트·이미지·오디오·영상을 출력합니다.

주요 기능
기술 사양
Omni Flash
Google Gemini Omni 패밀리의 첫 모델
Video
이미지·오디오 출력은 Gemini Omni 로드맵에 포함
Up to 10s
Flash 클립은 출시 시점 최대 10초로 제한, 접근성 확대 목적
Text, image, audio, video
하나의 Gemini Omni 프롬프트에서 자유롭게 조합
Voice references
음성 샘플 우선 지원, 전체 오디오 입력은 추후 추가
SynthID
모든 Gemini Omni 출력에 비가시 AI 출처 표시 워터마크
May 19, 2026
Google I/O 2026에서 공개
Google DeepMind
Any-to-any 영상 생성을 위한 Veo의 후속 포지셔닝
활용 사례
멀티 입력 스토리보딩
캐릭터 참조 이미지, 로케이션 사진, 음악 큐, 한 줄 비트를 함께 넣으면 Gemini Omni가 샷을 구성합니다. 같은 장면을 후속 프롬프트로 반복 수정할 수 있습니다.
대화형 영상 편집
기존 클립을 일상 언어로 묘사해 편집합니다. 의상 변경, 배경 교체, 조명 조정, 비트 타이밍 변경까지. Gemini Omni는 나머지 샷을 안정적으로 유지합니다.
마케팅 영상
브랜드 컬러, 제품 형태, 화면 위 텍스트를 살린 광고 컷을 생성합니다. 제품 사진, 보이스오버 참조, 장면 브리프를 한 프롬프트에 담아 완성된 광고를 만들 수 있습니다.
교육용 설명 영상
물리·현실 추론을 활용해 과학·역사·공학 개념을 시각화합니다. 정보의 정확성을 유지하면서 깔끔하고 발표용으로 적합한 영상을 얻을 수 있습니다.
아바타·스포크스퍼슨 영상
초상 이미지와 음성 참조를 결합하면 Gemini Omni가 여러 짧은 영상에서 같은 진행자 영상을 만들어냅니다. 강의 콘텐츠, 제품 설명, 소셜 숏폼에 적합합니다.
소셜 숏폼
10초 길이의 클립은 YouTube Shorts, Reels, TikTok 길이에 잘 맞습니다. 다시 프롬프트를 짜지 않고 대화로 변형을 만들어, 가장 잘 맞는 버전을 골라 게시할 수 있습니다.
프롬프트 예시






간단한 가격
오늘 무료로 시작하고 언제든지 업그레이드하거나 취소할 수 있습니다.
Basic
500 월간 크레딧
1 명 전용
모든 모델
워크플로
Standard
2800 월간 크레딧
1 명 전용
모든 모델
워크플로
Pro
6000 공유 월간 크레딧
1 사용자
모든 모델
워크플로
Pro Max
24000 공유 월간 크레딧
1 사용자
모든 모델
워크플로
Enterprise
더 높은 제한
사용자 정의
가격 및 청구 조건

Free
For playing around
$0
forever free
자주 묻는 질문
Ideogram 4.0
Ideogram
Ideogram의 오픈 웨이트 이미지 모델. 이미지 내 텍스트, 레이아웃 제어, 2K 출력.
Reve 2.0
Reve AI
Reve AI의 레이아웃 우선 이미지 모델. 모든 요소를 직접 배치하고, 결과를 디자인 파일처럼 편집하며, 최대 4K로 또렷한 텍스트를 렌더링합니다.
Bernini
ByteDance
지시 기반 편집을 위한 ByteDance의 오픈소스 영상 모델. 프레임의 나머지 영역은 그대로 잠그고 피사체의 정체성은 유지합니다.
Grok Imagine v1.5
xAI
네이티브 동기화 오디오를 갖춘 xAI의 이미지-영상 모델. 어떤 정지 이미지든 소리, 대사, 음악이 담긴 클립으로 살려냅니다.