오디오 생성
사용 가능

Gemini 3.1 Flash TTS

Google DeepMind 제공

Google의 가장 표현력 있는 텍스트 음성 변환. 오디오 태그와 다중 화자 대화 지원.

Gemini 3.1 Flash TTS

주요 기능

기술 사양

다국어

여러 언어에서 스타일·속도·액센트 제어

최대 2명

한 번의 다중 화자 생성에서 서로 다른 두 목소리

오디오 태그

일상적인 말 지시와 인라인 대괄호 태그

SynthID

출력에 적용되는 감지 불가능한 AI 출처 워터마크

활용 사례

영상 내레이션과 보이스오버

AI 또는 실사 영상에 자연스러운 내레이션을 더하고, 톤과 속도를 일상적인 말로 지정합니다.

캐릭터 대화

쇼츠, 게임, 설명 영상을 위한 두 화자 장면을 음성으로. 각 캐릭터에 고유한 목소리를 부여합니다.

현지화된 보이스오버

같은 대본을 여러 언어로, 네이티브 속도와 액센트로 내레이션합니다.

오디오북과 장편 콘텐츠

긴 내레이션에서도 자연스럽고 일관된 읽기를 유지합니다.

설명 영상과 튜토리얼

제품 워크스루, 강의, 하우투를 위한 명료하고 연출 가능한 내레이션.

광고 내레이션과 프로모

당신이 연출하는 에너지와 강조로, 표현력 있고 브랜드에 맞는 읽기를.

프롬프트 예시

부드러운 내레이션

이것을 부드럽고 천천히, 아이를 달래듯이 말해줘: 폭풍은 지나갔어. 이제 안전해.

Edit prompt

인라인 반응

네가 그걸 했다니 믿기지 않아 [laughs]. 올해 최고의 깜짝 선물이야.

Edit prompt

속삭임에서 평상시로

[whispering] 소리 내지 마. [normal voice] 좋아, 이제 괜찮아.

Edit prompt

액센트 제어

이것을 영국식 액센트로 읽어줘: Lovely weather we're having, isn't it?

Edit prompt

극적인 호흡

이것을 천천히 또박또박 읽어줘: 모든. 단어가. 중요해.

Edit prompt

두 화자 장면

Maya: 그 일자리 연락 받았어? Tom: 받았어. 월요일부터 시작해.

Edit prompt

간단한 가격

오늘 무료로 시작하고 언제든지 업그레이드하거나 취소할 수 있습니다.

Basic

$0/
청구 금액 $0

500 월간 크레딧

1 명 전용

모든 모델

워크플로

Standard

$0/
청구 금액 $0

2800 월간 크레딧

1 명 전용

모든 모델

워크플로

Pro

$0/
청구 금액 $0

6000 공유 월간 크레딧

1 사용자

+ 최대 4 명 추가 비용으로 추가 가능

모든 모델

워크플로

Pro Max

$0/
청구 금액 $0

24000 공유 월간 크레딧

1 사용자

+ 최대 9 명 추가 비용으로 추가 가능

모든 모델

워크플로

Enterprise

더 높은 제한

사용자 정의

가격 및 청구 조건

무제한 크레딧
맞춤형 시트 제한
모든 모델
워크플로
Pricing Gradient

Free

For playing around

$0

forever free

최대 20 크레딧
1명 전용
일부 모델
워크플로

자주 묻는 질문

Gemini 3.1 Flash TTS란 무엇인가요?
Gemini 3.1 Flash TTS는 2026년 4월 15일에 발표된 Google의 텍스트 음성 변환 모델입니다. 일상적인 말 지시와 인라인 오디오 태그로 연출할 수 있는 표현력 있고 자연스러운 내레이션을 생성하고, 다중 화자 대화를 지원하며, 모든 클립에 SynthID 워터마크를 적용합니다.
Morphic에서 무엇을 만들 수 있나요?
Gemini 3.1 Flash TTS는 보이스오버, 내레이션, 캐릭터 대화, 현지화된 읽기, 표현력 있는 광고 내레이션에 사용할 수 있습니다. Morphic에서 오디오를 생성한 뒤 같은 워크플로 안에서 Canvas의 영상 클립 옆에 배치하세요.
음성을 어떻게 연출하나요?
두 가지 방법이 있고, 함께 쓸 수 있습니다. 문장 앞에 '이것을 부드럽고 천천히:' 같은 일상적인 말 지시를 적고, [laughs]나 [whispering] 같은 대괄호 지시를 원하는 위치에 넣으세요. Gemini는 읽는 대신 그 연기를 수행합니다.
여러 화자를 지원하나요?
네. Gemini 3.1 Flash TTS는 한 번의 생성으로 두 화자의 주고받음을 음성으로 만들 수 있으며, 각 화자에게 서로 다른 목소리를 부여합니다. 각 문장에 화자 이름을 붙이고 생성 전에 각자에게 목소리를 배정하세요.
몇 개의 언어를 지원하나요?
Gemini 3.1 Flash TTS는 여러 언어로 내레이션하며, 각 언어에서 액센트·속도·스타일을 제어할 수 있습니다. 생성 전에 대본에 맞는 목소리와 언어를 선택하세요.
Morphic의 ElevenLabs와 어떻게 다른가요?
둘 다 Morphic에서 사람 수준의 음성을 생성합니다. ElevenLabs는 음성·음악·효과음을 아우르고 세밀한 음성 조정이 가능한 종합 오디오 스위트입니다. Gemini 3.1 Flash TTS는 표현력 있고 연출 가능한 발화에 집중하며, 일상적인 말 연출, 인라인 오디오 태그, 다중 화자 대화를 갖췄습니다. 많은 크리에이터가 한쪽은 음성에, 다른 한쪽은 음악과 효과음에 쓰며 둘을 함께 활용합니다.
오디오에 워터마크가 적용되나요?
네. Gemini 3.1 Flash TTS로 생성된 모든 클립에는 AI 출처를 위한 Google의 감지 불가능한 SynthID 워터마크가 적용됩니다. 청취자에게는 들리지 않으며 재인코딩 같은 일반적인 편집에도 견딥니다.
Morphic에서 Gemini 3.1 Flash TTS를 어떻게 사용하나요?
Morphic을 열고 프롬프트 바를 Audio로 전환한 뒤 Speech를 선택하세요. 오디오 모델로 Gemini 3.1 Flash TTS를 고르고, 연출이나 태그를 넣은 대본을 작성하고, 목소리와 언어를 선택한 뒤 생성하세요.