# 语音情绪控制

Morphic 上的语音情绪控制让你能够塑造生成语音的听感，从情绪语气到反应、节奏和表达风格都可调节。用合适的提示词来写你的指令，语音就会按照你的引导进行表演。

## 如何使用语音情绪控制

下面是一个关于如何在 Morphic 上使用语音情绪控制的快速教程：

1. 打开 Morphic 并进入你的项目。
2. 创建一个新文件或打开一个已有文件。
3. 在底部的提示栏中，将模式切换为“Audio”，并选择“Speech”。
4. 选择你的音频模型：“ElevenLabs”或“MiniMax”。
5. 从语音选择器中选择一个声音和语言。
6. 根据你选择的模型，使用相应的情绪控制格式编写提示词（见下文）。
7. 点击“Generate”。

Morphic 支持两种语音模型。每种模型使用不同的情绪控制语法。请选择你的模型，然后按照下面的指南操作。

## ElevenLabs

ElevenLabs 直接在提示词中使用方括号标签。将任何情绪、反应或指令包在方括号中，模型会将其解释为表演提示，而不是朗读文本。

### 工作原理

```
[tag] 你的对话文本写在这里。
```

标签会影响其后的一切内容，直到出现新的标签。你可以在文本的任何位置放置标签，并连续组合多个标签。

| 没有标签               | 使用标签                          |
| ------------------ | ----------------------------- |
| `我拿到这个角色了。我真的拿到了。` | `[excited] 我拿到这个角色了。我真的拿到了。`  |
| `我们得走了。现在。`        | `[whispers][tense] 我们得走了。现在。` |
| `我觉得这行不通。`         | `[sad][hesitant] 我觉得这行不通。`    |
| `宝藏埋在老礼拜堂下面。`      | `[pirate voice] 宝藏埋在老礼拜堂下面。`  |

ElevenLabs 是开放式的。没有固定列表。把任何情绪或指令写在方括号里，模型会尝试理解。像 `[jealous]`, `[romantic]`, `[awkward]`, `[suspicious tone]`，或者 `[continues after a beat]` 都可以。

下面的标签是常用且效果稳定的，但并不局限于这些。

### 标签

**情绪**

| 标签             | 作用          |
| -------------- | ----------- |
| `[excited]`    | 高能量、热情洋溢的表达 |
| `[happy]`      | 温暖、积极向上的语气  |
| `[cheerfully]` | 轻快、明亮的表达    |
| `[sad]`        | 低落、克制的语气    |
| `[sorrowful]`  | 深切的悲伤、哀痛    |
| `[angry]`      | 尖锐、有力的表达    |
| `[nervous]`    | 不确定、略带颤抖    |
| `[frustrated]` | 紧张、不耐烦的语气   |
| `[calm]`       | 平稳、放松的表达    |
| `[tired]`      | 低能量、疲惫不堪    |
| `[curious]`    | 好奇、探问的语气    |
| `[sarcastic]`  | 干涩、带讽刺意味的表达 |
| `[playful]`    | 轻松、逗趣的感觉    |
| `[deadpan]`    | 平淡、面无表情的表达  |

试试这个：

```
[excited] 我们刚刚拿到融资了。我简直不敢相信。[nervous] 但现在我们真的得交付成果了。[calm] 一步一步来。我们会解决的。
```

**情绪细微变化**

用于更细腻的语气转换。这些会为一句话增加层次，而不会覆盖整段表达。

| 标签                | 作用         |
| ----------------- | ---------- |
| `[hesitant]`      | 犹豫不决、有所保留  |
| `[relieved]`      | 如释重负、紧张释放  |
| `[tense]`         | 紧绷、在为某事做准备 |
| `[warm]`          | 温柔、关怀的语气   |
| `[resigned tone]` | 放弃抵抗、接受失败  |
| `[stammers]`      | 说话磕巴、局促不安  |
| `[regretful]`     | 希望事情有所不同   |
| `[sympathetic]`   | 富有同情心、能理解人 |
| `[reassuring]`    | 安慰人、稳重     |
| `[awe]`           | 被惊叹或震撼所触动  |

试试这个：

```
[tense] 有点不对劲。我能感觉到。[relieved] 哦，是你啊。谢天谢地。[warm] 过来吧。我很担心你。
```

**反应**

用于在句子之间或句子内部添加更真实的非语言声音。

| 标签                | 作用             |
| ----------------- | -------------- |
| `[laughs]`        | 放声大笑           |
| `[giggles]`       | 轻柔、浅浅的笑        |
| `[light chuckle]` | 短促、克制的笑        |
| `[sigh]`          | 疲惫、如释重负或沮丧时的叹气 |
| `[gasps]`         | 突然吸气，表示惊讶或震惊   |
| `[gulps]`         | 紧张地吞咽          |
| `[crying]`        | 带着哭腔、声音哽咽      |
| `[clears throat]` | 快速清嗓           |

试试这个：

```
[laughs] 你在跟我开玩笑吧。[gasps] 等等，你是认真的？[clears throat] 好吧。我们认真谈谈这件事。
```

**表达方式**

控制语音在生理上的表达方式，与情绪无关。

| 标签                | 作用          |
| ----------------- | ----------- |
| `[whispers]`      | 轻柔、气声、贴近的表达 |
| `[shouts]`        | 大声、外放的声音    |
| `[quietly]`       | 低音量、收敛      |
| `[loudly]`        | 提高音量、有力地表达  |
| `[rushed]`        | 快速、紧迫的节奏    |
| `[drawn out]`     | 缓慢、拖长的表达    |
| `[dramatic tone]` | 戏剧化、强烈的表现   |

试试这个：

```
[whispers] 他们就在门外。[rushed] 我们现在得走了，没时间了。[shouts] 快跑！
```

**口音与角色**

在不改变声音的情况下切换口音，或者赋予语音一个角色人格。

| 标签                        | 作用            |
| ------------------------- | ------------- |
| `[American accent]`       | 标准美式英语        |
| `[British accent]`        | 标准英式英语        |
| `[French accent]`         | 带法语口音的英语      |
| `[Southern US accent]`    | 美国南方口音        |
| `[Australian accent]`     | 澳大利亚英语        |
| `[strong Russian accent]` | 浓重的俄式口音       |
| `[strong X accent]`       | 将 X 替换为任意国籍   |
| `[pirate voice]`          | 粗哑的海盗式角色声音    |
| `[old man voice]`         | 苍老、饱经风霜的表达    |
| `[robot voice]`           | 机械、合成感的语气     |
| `[fantasy narrator]`      | 史诗般的童话叙述      |
| `[film noir narrator]`    | 黑暗、忧郁、愤世嫉俗的旁白 |
| `[sarcastically]`         | 干涩、带讽刺意味的角色读法 |

试试这个：

```
[pirate voice] 宝藏藏在老礼拜堂下面，埋在三寻深的地方。[old man voice] 我记得那时镇上除了土路和老实人，什么都没有。[robot voice] 警告。结构完整性受损。请立即撤离。
```

### 多角色对话

当你在一个提示词中写有两个或更多角色的场景时，用这些标签来塑造台词之间的互动。

| 标签               | 作用              |
| ---------------- | --------------- |
| `[interrupting]` | 在对方说完之前打断       |
| `[overlapping]`  | 在另一个声音还未结束时开始说话 |

试试这个：

```
所以我想说的是 [interrupting] 不，停下。你别想把这事糊弄过去。[overlapping] 但如果你愿意听我说一下……
```

### 停顿与节奏

ElevenLabs 不支持明确的停顿时长。停顿长度会根据上下文、标签和标点来推断。

| 这样写       | 作用             |
| --------- | -------------- |
| `[pause]` | 戏剧性沉默（由模型决定时长） |
| `...`     | 犹豫、拖尾式停顿       |
| 全部大写      | 强调该词           |
| 新段落       | 明显的停顿和语调重置     |

试试这个：

```
“我……嗯，我想是吧。”

[pause] 然后它就发生了。

“我说的是现在！”
```

### 获得更好效果的技巧

| 技巧                        | 为什么有效                                                              |
| ------------------------- | ------------------------------------------------------------------ |
| 让标签与文本匹配                  | `[crying] 别离开我。` 听起来很自然。把 `[crying]` 加到一句随意的话里就不自然了。模型会读取整句来获取上下文。 |
| 组合标签                      | `[whispers][tense]` 或者 `[hesitant][nervous]` 会给模型两个提示，让它融合出更细腻的输出。 |
| 选择合适的声音                   | 平静的声音不会有说服力地大喊。高能量的声音也不适合低声耳语。要让声音与角色匹配。                           |
| 使用 Creative 或 Natural 稳定性 | 这些设置会给模型更多空间去表达标签。Robust 更一致，但表现力较弱。                               |
| 把标点当作节奏提示                 | 逗号会放慢节奏。句号会形成强停顿。省略号则会拖尾。模型会读取并响应标点。                               |

## MiniMax

MiniMax 使用 **括号式声音标签** 在你的提示词中，以及 Morphic 界面里的一个单独的 **情绪选择器** 。

### 情绪

在生成时从下拉菜单中选择情绪。这会为整个输出设置整体基调。

| 情绪 | 效果                   |
| -- | -------------------- |
| 自动 | 模型读取文本并选择最合适的情绪（默认）  |
| 快乐 | 轻快、积极                |
| 悲伤 | 低落、忧郁                |
| 愤怒 | 有力、攻击性强              |
| 恐惧 | 焦虑、害怕                |
| 厌恶 | 反感、排斥                |
| 惊讶 | 受惊、震惊                |
| 平静 | 放松、宁静                |
| 流利 | 干净、播音风格——非常适合新闻或技术解说 |
| 中性 | 没有情绪偏向               |

### 声音标签

使用括号直接在提示词中添加非语言声音。这些是 **仅限预设** ——只支持下面列出的标签。

```
太不可思议了 (laughs) 我简直不敢相信它真的成功了。
结果……出乎意料。(sighs) 让我解释一下。
```

| 标签               | 标签          | 标签               |
| ---------------- | ----------- | ---------------- |
| `(laughs)`       | `(chuckle)` | `(coughs)`       |
| `(clear-throat)` | `(groans)`  | `(breath)`       |
| `(pant)`         | `(inhale)`  | `(exhale)`       |
| `(gasps)`        | `(sniffs)`  | `(sighs)`        |
| `(snorts)`       | `(burps)`   | `(lip-smacking)` |
| `(humming)`      | `(hissing)` | `(emm)`          |
| `(whistles)`     | `(sneezes)` | `(crying)`       |
| `(applause)`     | `(yawns)`   |                  |

> 与 ElevenLabs 不同，你 **不能** 创建自定义标签。写 `(nervous)` 或者 `(jealous)` 不会起作用——模型会把它们当作文本朗读。情绪语气请使用情绪选择器。

### 停顿

使用 `<#x#>` 来插入定时静音，其中 `x` 表示秒数（0.01–99.99）。

```
结果出乎意料。<#1.2#> 让我们来看看原因。
我们需要谈谈。<#0.5#> 这很重要。
```

### 技巧

* 谨慎使用声音标签——太多会显得不自然。
* 将情绪设置为 **自动** 适用于大多数情况。在需要长文本保持一致语气时，可手动覆盖。
* 标点很重要——逗号和句号会引导模型的节奏和语调。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://morphic.com/docs/zh/yin-pin/voice-emotion-control.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
