> For the complete documentation index, see [llms.txt](https://morphic.com/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://morphic.com/docs/jp/yin-sheng/voice-emotion-control.md).

# 音声の感情コントロール

Morphic の音声感情コントロールを使うと、感情のトーンから反応、テンポ、話し方まで、生成音声の聞こえ方を自在に調整できます。適切な合図を入れてプロンプトを書けば、音声は指示どおりに演じます。

## 音声感情コントロールの使い方

Morphic で音声感情コントロールを使う簡単なチュートリアルです:

1. Morphic を開いて、プロジェクトに移動します。
2. 新しいファイルを作成するか、既存のファイルを開きます。
3. 下部のプロンプトバーでモードを 'Audio' に切り替え、'Speech' を選択します。
4. 音声モデルを選択します: 'ElevenLabs' または 'MiniMax'。
5. 音声ピッカーで音声と言語を選択します。
6. 選択したモデルに合わせた感情コントロール形式でプロンプトを書いてください（下記参照）。
7. 'Generate' をクリックします。

Morphic は 2 つの音声モデルをサポートしています。それぞれ感情コントロールの構文が異なります。モデルを選んだら、下のガイドに従ってください。

## ElevenLabs

ElevenLabs では、角括弧のタグをプロンプトに直接書きます。感情、反応、指示はすべて角括弧で囲むと、モデルはそれを話し言葉ではなく演技指示として解釈します。

### 仕組み

```
[tag] ここにセリフのテキストを書きます。
```

タグは新しいタグが現れるまで、その後に続くすべてに影響します。タグはテキストのどこにでも置けて、複数のタグを連続して組み合わせることもできます。

| タグなし                      | タグあり                                |
| ------------------------- | ----------------------------------- |
| `やった、役をもらえた。本当に役をもらえたんだ。` | `[excited] やった、役をもらえた。本当に役をもらえたんだ。` |
| `出発しないと。今すぐ。`             | `[whispers][tense] 出発しないと。今すぐ。`     |
| `うまくいくとは思えない。`            | `[sad][hesitant] うまくいくとは思えない。`      |
| `宝は古い礼拝堂の下に埋まっている。`       | `[pirate voice] 宝は古い礼拝堂の下に埋まっている。`  |

ElevenLabs は自由記述式です。固定リストはありません。角括弧内に任意の感情や指示を書けば、モデルがそれを解釈しようとします。たとえば、 `[jealous]`, `[romantic]`, `[awkward]`, `[suspicious tone]`や `[continues after a beat]` のようなタグはすべて使えます。

以下のタグはよく使われ、安定して効果がありますが、これだけに限定されるわけではありません。

### タグ

**感情**

| タグ             | 効果                 |
| -------------- | ------------------ |
| `[excited]`    | 高エネルギーで熱意のある話し方    |
| `[happy]`      | 温かく、明るいトーン         |
| `[cheerfully]` | 軽やかで明るい話し方         |
| `[sad]`        | 沈んだ、控えめなトーン        |
| `[sorrowful]`  | 深い悲しみ、悲嘆           |
| `[angry]`      | 鋭く、力強い話し方          |
| `[nervous]`    | 不安げで、少し震えた感じ       |
| `[frustrated]` | 緊張した、苛立ったトーン       |
| `[calm]`       | 安定した、落ち着いた話し方      |
| `[tired]`      | 低エネルギーで、疲れ切った感じ    |
| `[curious]`    | 好奇心のある、問いかけるようなトーン |
| `[sarcastic]`  | 乾いた、皮肉っぽい話し方       |
| `[playful]`    | 軽く、からかうようなエネルギー    |
| `[deadpan]`    | 平板で感情のない話し方        |

試してみてください:

```
[excited] ついに資金調達できた。信じられない。 [nervous] でも、ここから本当に成果を出さなきゃいけない。 [calm] 一歩ずつやろう。きっと何とかなる。
```

**感情のニュアンス**

トーンをより繊細に変化させたいときに使います。全体の話し方を覆い隠すことなく、セリフに深みを加えます。

| タグ                | 効果                    |
| ----------------- | --------------------- |
| `[hesitant]`      | 自信がなく、ためらっている         |
| `[relieved]`      | 重荷が下り、緊張がほどけた感じ       |
| `[tense]`         | 張りつめた、何かに備えている感じ      |
| `[warm]`          | やさしく、思いやりのあるトーン       |
| `[resigned tone]` | 諦めて、敗北を受け入れている        |
| `[stammers]`      | 言葉につまずき、うろたえている       |
| `[regretful]`     | 何かが違っていたらよかったのにと思っている |
| `[sympathetic]`   | 思いやりがあり、理解を示す         |
| `[reassuring]`    | 安心させるような、落ち着いた        |
| `[awe]`           | 驚きや畏敬の念に打たれる          |

試してみてください:

```
[tense] 何かがおかしい。感じるんだ。 [relieved] ああ、君か。神様、よかった。 [warm] こっちへ来て。君のことが心配だった。
```

**反応**

セリフの間や中に入れて、リアリティを加える非言語音です。

| タグ                | 効果              |
| ----------------- | --------------- |
| `[laughs]`        | 大笑い             |
| `[giggles]`       | やわらかく、軽い笑い      |
| `[light chuckle]` | 短く、控えめな笑い       |
| `[sigh]`          | 疲労、安堵、苛立ちからの息吐き |
| `[gasps]`         | 驚きや衝撃で鋭く息を吸い込む  |
| `[gulps]`         | 緊張してごくりと飲み込む    |
| `[crying]`        | 涙声で、声が詰まる       |
| `[clears throat]` | 短い声の立て直し        |

試してみてください:

```
[laughs] まさか、冗談だろ。 [gasps] え、本気なの？ [clears throat] よし。ちゃんと話し合おう。
```

**話し方**

感情とは独立して、音声がそのセリフを物理的にどう演じるかを制御します。

| タグ                | 効果                   |
| ----------------- | -------------------- |
| `[whispers]`      | 柔らかく、息混じりで、近い距離感の話し方 |
| `[shouts]`        | 大きく、はっきり届く声          |
| `[quietly]`       | 小さな声量で、抑え気味          |
| `[loudly]`        | 声量を上げて、力強く           |
| `[rushed]`        | 速いテンポで、切迫したリズム       |
| `[drawn out]`     | ゆっくりと引き伸ばした話し方       |
| `[dramatic tone]` | 劇的で、強調された迫力          |

試してみてください:

```
[whispers] ドアのすぐ外にいる。 [rushed] 今すぐ動かないと、時間がない。 [shouts] 走れ！
```

**アクセントとキャラクター**

声自体は変えずにアクセントを切り替えたり、声にキャラクターの人格を与えたりできます。

| タグ                        | 効果                 |
| ------------------------- | ------------------ |
| `[American accent]`       | 標準的なアメリカ英語         |
| `[British accent]`        | 標準的なイギリス英語         |
| `[French accent]`         | フランス訛りの英語          |
| `[Southern US accent]`    | アメリカ南部風のなまり        |
| `[Australian accent]`     | オーストラリア英語          |
| `[strong Russian accent]` | 強いロシア訛り            |
| `[strong X accent]`       | X を任意の国籍に置き換えてください |
| `[pirate voice]`          | 荒々しい、海の男風のキャラクター   |
| `[old man voice]`         | 年老いて、風化したような話し方    |
| `[robot voice]`           | 機械的で、合成音声のようなトーン   |
| `[fantasy narrator]`      | 壮大な、おとぎ話のような語り     |
| `[film noir narrator]`    | 暗く、陰鬱で、皮肉っぽい語り     |
| `[sarcastically]`         | 乾いた、皮肉っぽいキャラクター演技  |

試してみてください:

```
[pirate voice] 宝は古い礼拝堂の下、三尋の深さに埋まっている。 [old man voice] この町に土の道と正直な人たちしかいなかった頃を覚えているよ。 [robot voice] 警告。構造的完全性が損なわれています。直ちに避難してください。
```

### 複数キャラクターの会話

1 つのプロンプトで 2 人以上のキャラクターを含むシーンを書くときは、セリフ同士のやり取りを形作るためにこれらを使います。

| タグ               | 効果               |
| ---------------- | ---------------- |
| `[interrupting]` | 相手のセリフが終わる前に割り込む |
| `[overlapping]`  | 別の声が終わる途中で話し始める  |

試してみてください:

```
言おうとしていたのは [interrupting] いや、やめて。言い訳はさせない。 [overlapping] でも、少し聞いてくれれば...
```

### 間とテンポ

ElevenLabs は明示的な休止時間をサポートしていません。休止の長さは文脈、タグ、句読点から推定されます。

| 次のように書いてください | 効果                    |
| ------------ | --------------------- |
| `[pause]`    | 劇的な沈黙（長さはモデルが決定）      |
| `...`        | ためらいがちに、余韻を残す間        |
| ALL CAPS     | その単語を強調する             |
| 新しい段落        | はっきりした間とイントネーションのリセット |

試してみてください:

```
"I... yeah, I guess so."

"[pause] それから、それは起こった。"

"今だって言っただろ！"
```

### より良い結果のためのヒント

| ヒント                          | なぜ効果的か                                                                                    |
| ---------------------------- | ----------------------------------------------------------------------------------------- |
| タグを本文に合わせる                   | `[crying] 行かないで。` 自然に聞こえます。追加するのは `[crying]` カジュアルな文に付けても自然ではありません。モデルは文脈のために行全体を読み取ります。  |
| タグを組み合わせる                    | `[whispers][tense]` または `[hesitant][nervous]` とすると、モデルに 2 つの合図を与えて、より繊細な出力に混ぜ合わせることができます。 |
| 適切な声を選ぶ                      | 落ち着いた声で、説得力のある叫びはできません。高エネルギーの声で、うまくささやくこともできません。役柄に合った声を選びましょう。                          |
| Creative または Natural の安定性を使う | これらの設定は、モデルがタグをより表現しやすくします。Robust はより安定していますが、表現力は控えめです。                                  |
| 句読点をリズムの合図として使う              | コンマはテンポを落とします。ピリオドは強い区切りになります。省略記号は余韻を残します。モデルは句読点を読み取り、それに反応します。                         |

## Google Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS は、幅広い言語にわたってトーン、テンポ、アクセントを細かく制御しながら、表情豊かな多言語ナレーションを実現します。指示の方法は 2 つあります。平易な言葉で書く方法と、台本に直接書き込むインラインの合図を使う方法です。

### 仕組み

Gemini は自然な言葉で書いた指示を読み取り、それに合わせて話し方を形作ります。まず指示を書き、そのあとにセリフを書いてください。

| 指示なし              | 指示あり                                             |
| ----------------- | ------------------------------------------------ |
| 嵐は過ぎ去りました。もう安全です。 | 子どもをなだめるように、温かくゆっくりとこう言ってください: 嵐は過ぎ去りました。もう安全です。 |

また、角括弧のインライン合図を入れて、反応を追加したり、途中で話し方を変えたりできます。Gemini はそれを声に出して読むのではなく、合図どおりに演じます。

試してみてください: `そんなことをしたなんて信じられない [laughs]。今年一番のサプライズだ。`

### タグ

合図は、セリフの入れたい場所にそのまま角括弧で入れてください。Gemini はそれを声に出して読むのではなく合図どおりに演じ、1 つの台本に複数入れることもできます。

反応と音:

| タグ                  | 効果                   |
| ------------------- | -------------------- |
| \[laughs]           | 自然な笑いを加える            |
| \[laughs nervously] | 緊張した笑いを加える           |
| \[sighs]            | ため息を加える              |
| \[gasps]            | 鋭く息を吸い込む音を加える        |
| \[exhales]          | 聞こえる息吐きを加える          |
| \[scoffs]           | 軽蔑するような鼻で笑う音を加える     |
| \[clears throat]    | セリフの前に喉を鳴らして整える音を加える |
| \[crying]           | 涙声でセリフを届ける           |

話し方とトーン:

| タグ              | 効果                  |
| --------------- | ------------------- |
| \[whispering]   | 声をささやき声に落とす         |
| \[normal voice] | 通常の話し声に戻す           |
| \[softly]       | 話し方をやわらげる           |
| \[shouting]     | 声を上げて叫ぶ             |
| \[slowly]       | テンポを遅くする            |
| \[excited]      | エネルギーと高揚感を加える       |
| \[nervously]    | 緊張した、ためらいがちなトーンを加える |

試してみてください: `[whispering] 音を立てないで。 [normal voice] よし、もう大丈夫だ。`

トーン、エネルギー、アクセントについては、セリフの前に平易な言葉で希望を伝えてください。Gemini は各言語でアクセント制御をサポートしています。

試してみてください: `英国アクセントでこれを読んでください: いい天気ですね、そうでしょう？`

### 複数話者の会話

Gemini は 1 回の生成で 2 人の話者によるやり取りを音声化でき、それぞれに別の声を割り当てられます。各セリフの先頭に話者名を付け、そのうえで生成前に各話者へ声を割り当ててください。Gemini は 1 つの会話につき最大 2 人の話者をサポートします。

試してみてください:

```
Maya: 仕事の件、返事来た？
Tom: 来たよ。月曜から始める。
Maya: すごい、おめでとう。
```

| 項目     | やること                     |
| ------ | ------------------------ |
| 話者ラベル  | 各行の先頭に話者名とコロンを付ける        |
| 話者ごとの声 | 生成前に、名前付きの各話者へ個別の声を割り当てる |
| 話者数の上限 | 1 つの会話につき最大 2 人の異なる話者    |

### 間とテンポ

省略記号を使って一拍の間を入れ、指示で希望するテンポを伝えます。

| 方法           | 例                                       |
| ------------ | --------------------------------------- |
| 間を入れるための省略記号 | `ちょっと待って... ... ... 聞こえた？`              |
| 指示でテンポを指定する  | `ゆっくり、そして意図的にこう読んでください: すべて。の。言葉。が。大事。` |

### より良い結果のためのヒント

| ヒント         | 役立つ理由                                                     |
| ----------- | --------------------------------------------------------- |
| 指示をセリフの前に置く | Gemini は、その後に続くテキストに指示を適用します                              |
| シーンを設定する    | たとえば、次のような文脈: `自然ドキュメンタリーを、落ち着いた小声でナレーションする:` トーンと話し方を形作る |
| 方法を組み合わせる   | 平易な言葉での指示と、角括弧のインライン合図を同じ台本で組み合わせる                        |
| 言語に合う声を選ぶ   | 生成前に、台本に合った声と言語を選んでください                                   |

## MiniMax

MiniMax では **括弧付きの音声タグ** をプロンプトに使い、別途 **感情セレクター** を Morphic の UI で指定します。

### 感情

生成時にドロップダウンから感情を選択します。これにより、出力全体のトーンが決まります。

| 感情        | 効果                              |
| --------- | ------------------------------- |
| 自動        | モデルがテキストを読み取り、最適な感情を選びます（既定）    |
| Happy     | 明るく、ポジティブ                       |
| Sad       | 沈んだ、憂鬱な                         |
| Angry     | 力強く、攻撃的                         |
| Fearful   | 不安げで、怖がっている                     |
| Disgusted | 嫌悪している、拒絶している                   |
| Surprised | 驚いた、仰天した                        |
| Calm      | 落ち着いた、穏やかな                      |
| Fluent    | 明瞭で放送向けのスタイル — ニュースや技術ナレーションに最適 |
| Neutral   | 感情的な偏りなし                        |

### 音声タグ

括弧を使って、非言語音をプロンプトに直接追加します。これらは **プリセットのみ** — 以下に挙げるタグのみがサポートされています。

```
すごい (laughs) 本当にうまくいくなんて信じられない。
結果は... 予想外でした。 (sighs) 説明させてください。
```

| タグ        | タグ          | タグ         |
| --------- | ----------- | ---------- |
| `(笑う)`    | `(くすくす笑う)`  | `(咳をする)`   |
| `(咳払い)`   | `(うめく)`     | `(息)`      |
| `(あえぐ)`   | `(吸う)`      | `(吐く)`     |
| `(息をのむ)`  | `(鼻をすする)`   | `(ため息をつく)` |
| `(鼻を鳴らす)` | `(げっぷをする)`  | `(舌なめずり)`  |
| `(ハミング)`  | `(シーッという)`  | `(えーと)`    |
| `(口笛を吹く)` | `(くしゃみをする)` | `(泣く)`     |
| `(拍手)`    | `(あくびをする)`  |            |

> ElevenLabsとは異なり、あなたは **できません** カスタムタグを作成することはできません。記述しても `(緊張)` または `(嫉妬)` は機能しません—モデルはそれらをテキストとして読み上げます。感情のトーンには感情セレクターを使用してください。

### 一時停止

を使って、時間指定の無音を挿入します `<#x#>` ここで `x` は秒です（0.01〜99.99）。

```
結果は予想外でした。 <#1.2#> その理由を見ていきましょう。
話したいことがあります。 <#0.5#> 大事なことです。
```

### ヒント

* サウンドタグは控えめに使ってください — 多すぎると不自然に聞こえることがあります。
* 感情を設定する **自動** ほとんどの場合はそのままで構いません。長文全体で一貫したトーンが必要なときは、手動で上書きしてください。
* 句読点は重要です — カンマとピリオドが、モデルの間の取り方とイントネーションを導きます。


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://morphic.com/docs/jp/yin-sheng/voice-emotion-control.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.