Question 1

什么是 Gemini 3.1 Flash TTS？

Accepted Answer

Gemini 3.1 Flash TTS 是 Google 的文本转语音模型，于 2026 年 4 月 15 日发布。它能生成富有表现力的自然旁白，可用平实话语指示和内嵌音频标签来调度，支持多人对话，并为每段片段添加 SynthID 水印。

Question 2

我能在 Morphic 上创作什么？

Accepted Answer

Gemini 3.1 Flash TTS 可用于配音、旁白、角色对话、本地化口播以及富有表现力的广告口播。在 Morphic 上生成音频，然后在同一工作流中将其放到 Canvas 的视频片段旁边。

Question 3

如何调度声音？

Accepted Answer

有两种方式，且可以组合使用。在句子前写下平实话语指示，例如「把这句温柔而缓慢地说：」，并在想要的位置加入方括号提示，例如 [laughs] 或 [whispering]。Gemini 会表演该提示，而不是把它读出来。

Question 4

它支持多位说话人吗？

Accepted Answer

支持。Gemini 3.1 Flash TTS 可在一次生成中让两位说话人来回对话，并为每位赋予不同的声音。为每句标注说话人姓名，并在生成前为各自分配声音。

Question 5

它支持多少种语言？

Accepted Answer

Gemini 3.1 Flash TTS 能用多种语言朗读，并在每种语言中控制口音、节奏与风格。生成前请选择契合脚本的声音与语言。

Question 6

它与 Morphic 上的 ElevenLabs 有何不同？

Accepted Answer

两者都能在 Morphic 上生成媲美真人的声音。ElevenLabs 是一套完整的音频套件，涵盖语音、音乐与音效，并提供精细的声音调节。Gemini 3.1 Flash TTS 专注于富有表现力、可调度的语音，具备平实话语调度、内嵌音频标签和多人对话。许多创作者会同时使用两者，一个用于声音，另一个用于音乐与音效。

Question 7

它会为音频添加水印吗？

Accepted Answer

会。Gemini 3.1 Flash TTS 生成的每段片段都带有 Google 不可察觉的 SynthID 水印以标明 AI 来源。它对听众不可闻，并能在重新编码等常见编辑后保留。

Question 8

如何在 Morphic 上使用 Gemini 3.1 Flash TTS？

Accepted Answer

打开 Morphic，将提示栏切换到 Audio 并选择 Speech。选择 Gemini 3.1 Flash TTS 作为音频模型，写下带有调度或标签的脚本，选择声音与语言，然后生成。

Gemini 3.1 Flash TTS

核心功能

富有表现力的旁白

口语化指导

内嵌音频标签

多人对话

多语言与口音控制

SynthID 水印

技术规格

应用场景

视频旁白与配音

角色对话

本地化配音

有声书与长篇内容

讲解与教程

广告口播与宣传

提示词示例

温柔的旁白

内嵌反应

从耳语到正常

口音控制

戏剧性的停顿

双人场景

简单定价

常见问题

其他模型