Gemini 3.1 Flash TTS
Google DeepMind 제공
Google의 가장 표현력 있는 텍스트 음성 변환. 오디오 태그와 다중 화자 대화 지원.

주요 기능
기술 사양
다국어
여러 언어에서 스타일·속도·액센트 제어
최대 2명
한 번의 다중 화자 생성에서 서로 다른 두 목소리
오디오 태그
일상적인 말 지시와 인라인 대괄호 태그
SynthID
출력에 적용되는 감지 불가능한 AI 출처 워터마크
활용 사례
영상 내레이션과 보이스오버
AI 또는 실사 영상에 자연스러운 내레이션을 더하고, 톤과 속도를 일상적인 말로 지정합니다.
캐릭터 대화
쇼츠, 게임, 설명 영상을 위한 두 화자 장면을 음성으로. 각 캐릭터에 고유한 목소리를 부여합니다.
현지화된 보이스오버
같은 대본을 여러 언어로, 네이티브 속도와 액센트로 내레이션합니다.
오디오북과 장편 콘텐츠
긴 내레이션에서도 자연스럽고 일관된 읽기를 유지합니다.
설명 영상과 튜토리얼
제품 워크스루, 강의, 하우투를 위한 명료하고 연출 가능한 내레이션.
광고 내레이션과 프로모
당신이 연출하는 에너지와 강조로, 표현력 있고 브랜드에 맞는 읽기를.
프롬프트 예시
간단한 가격
오늘 무료로 시작하고 언제든지 업그레이드하거나 취소할 수 있습니다.
Basic
500 월간 크레딧
1 명 전용
모든 모델
워크플로
Standard
2800 월간 크레딧
1 명 전용
모든 모델
워크플로
Pro
6000 공유 월간 크레딧
1 사용자
모든 모델
워크플로
Pro Max
24000 공유 월간 크레딧
1 사용자
모든 모델
워크플로
Enterprise
더 높은 제한
사용자 정의
가격 및 청구 조건

Free
For playing around
$0
forever free
자주 묻는 질문
다른 모델
Morphic 모델 카탈로그를 더 둘러보세요.
Ideogram 4.0
Ideogram
Ideogram의 오픈 웨이트 이미지 모델. 이미지 내 텍스트, 레이아웃 제어, 2K 출력.
Reve 2.0
Reve AI
Reve AI의 레이아웃 우선 이미지 모델. 모든 요소를 직접 배치하고, 결과를 디자인 파일처럼 편집하며, 최대 4K로 또렷한 텍스트를 렌더링합니다.
Bernini
ByteDance
지시 기반 편집을 위한 ByteDance의 오픈소스 영상 모델. 프레임의 나머지 영역은 그대로 잠그고 피사체의 정체성은 유지합니다.
Grok Imagine v1.5
xAI
네이티브 동기화 오디오를 갖춘 xAI의 이미지-영상 모델. 어떤 정지 이미지든 소리, 대사, 음악이 담긴 클립으로 살려냅니다.