> For the complete documentation index, see [llms.txt](https://morphic.com/docs/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://morphic.com/docs/jp/dio/voice-emotion-control.md).

# 音声感情制御

Morphic の音声感情コントロールを使うと、感情のトーンから反応、テンポ、話し方のスタイルまで、生成される音声の звучりを自在に調整できます。適切な指示を入れてプロンプトを書けば、音声はあなたの意図どおりに表現されます。

## 音声感情コントロールの使い方

Morphic で音声感情コントロールを使う簡単なチュートリアルです:

1. Morphic を開いて、プロジェクトに移動します。
2. 新しいファイルを作成するか、既存のファイルを開きます。
3. 下部のプロンプトバーでモードを「Audio」に切り替え、「Speech」を選択します。
4. 音声モデルとして「ElevenLabs」または「MiniMax」を選びます。
5. 音声ピッカーから声と言語を選択します。
6. 選択したモデル用の感情コントロール形式を使ってプロンプトを書きます（下記参照）。
7. 「Generate」をクリックします。

Morphic は 2 つの音声モデルをサポートしています。感情コントロールの構文はそれぞれ異なります。モデルを選択してから、以下のガイドに従ってください。

## ElevenLabs

ElevenLabs では、プロンプト内に直接書く角括弧のタグを使います。感情、反応、指示を角括弧で囲むと、それは読み上げる文字ではなく、演技指示として解釈されます。

### 使い方

```
[tag] ここにセリフを入力します。
```

タグは、新しいタグが現れるまで、その後のすべてに影響します。タグはテキストのどこにでも置け、複数のタグを連続して組み合わせることもできます。

| タグなし                 | タグあり                               |
| -------------------- | ---------------------------------- |
| `役が取れた。ほんとに役が取れたんだ。` | `[excited] 役が取れた。ほんとに役が取れたんだ。`     |
| `出発しないと。今すぐ。`        | `[whispers][tense] 出発しないと。今すぐ。`    |
| `これはうまくいかない気がする。`    | `[sad][hesitant] これはうまくいかない気がする。`  |
| `宝は古い礼拝堂の下に埋まっている。`  | `[pirate voice] 宝は古い礼拝堂の下に埋まっている。` |

ElevenLabs はオープンエンドです。固定リストはありません。任意の感情や指示を角括弧の中に書けば、モデルはそれを解釈しようとします。たとえば `[jealous]`, `[romantic]`, `[awkward]`, `[suspicious tone]`、または `[continues after a beat]` など、すべて使えます。

以下のタグは一般的によく使われ、安定して効果がありますが、これらに限定されるわけではありません。

### タグ

**感情**

| タグ             | 働き                 |
| -------------- | ------------------ |
| `[excited]`    | ハイエナジーで、熱量の高い話し方   |
| `[happy]`      | 温かく、前向きなトーン        |
| `[cheerfully]` | 軽やかで明るい話し方         |
| `[sad]`        | 沈んだ、抑えたトーン         |
| `[sorrowful]`  | 深い悲しみ、悲嘆           |
| `[angry]`      | 鋭く、力強い話し方          |
| `[nervous]`    | 不安げで、少し震えた感じ       |
| `[frustrated]` | 張りつめた、いら立ったトーン     |
| `[calm]`       | 安定した、リラックスした話し方    |
| `[tired]`      | エネルギーが低く、疲れ切った感じ   |
| `[curious]`    | 好奇心があり、問いかけるようなトーン |
| `[sarcastic]`  | 乾いた、皮肉っぽい話し方       |
| `[playful]`    | 軽やかで、からかうような雰囲気    |
| `[deadpan]`    | 平板で、感情のない話し方       |

試してみましょう:

```
[excited] 資金調達できた。信じられない。 [nervous] でも、今度は本当に成果を出さないといけない。 [calm] 一歩ずついこう。なんとかなるはずだ。
```

**感情のニュアンス**

より繊細なトーンの変化に使います。全体の話し方を上書きせずに、セリフに深みを加えます。

| タグ                | 働き               |
| ----------------- | ---------------- |
| `[hesitant]`      | 自信がなく、ためらっている    |
| `[relieved]`      | 重荷が下り、緊張が解けた     |
| `[tense]`         | 神経が張りつめ、何かに備えている |
| `[warm]`          | やさしく、思いやりのあるトーン  |
| `[resigned tone]` | 諦めて、敗北を受け入れる     |
| `[stammers]`      | 言葉に詰まり、うろたえている   |
| `[regretful]`     | 何かが違っていればと願う     |
| `[sympathetic]`   | 思いやりがあり、理解を示す    |
| `[reassuring]`    | 安心させるような、落ち着いた   |
| `[awe]`           | 驚きや感嘆に打たれる       |

試してみましょう:

```
[tense] 何かがおかしい。そう感じる。 [relieved] ああ、君だったのか。よかった。 [warm] こっちへ。君のことが心配だったんだ。
```

**反応**

セリフの間や中にリアリティを加える、言葉以外の音です。

| タグ                | 働き                   |
| ----------------- | -------------------- |
| `[laughs]`        | しっかりした笑い             |
| `[giggles]`       | やわらかく軽い笑い            |
| `[light chuckle]` | 短く抑えた笑い              |
| `[sigh]`          | 疲労、安堵、またはいら立ちのための息吐き |
| `[gasps]`         | 驚きやショックによる鋭い息の吸い込み   |
| `[gulps]`         | 緊張した飲み込み             |
| `[crying]`        | 涙ぐんだ、声が詰まった感じ        |
| `[clears throat]` | 素早い声のリセット            |

試してみましょう:

```
[laughs] まさか、冗談でしょ。 [gasps] え、今の本気？ [clears throat] ええと。ちゃんと話しましょう。
```

**話し方**

感情とは独立して、声がセリフをどう物理的に演じるかを制御します。

| タグ                | 働き                   |
| ----------------- | -------------------- |
| `[whispers]`      | やわらかく、息を含んだ、近い距離の話し方 |
| `[shouts]`        | 大きく、通る声              |
| `[quietly]`       | 小さな音量で、抑えめ           |
| `[loudly]`        | 音量を上げた、力強い話し方        |
| `[rushed]`        | 速いテンポで、切迫感のあるリズム     |
| `[drawn out]`     | ゆっくり、引き伸ばした話し方       |
| `[dramatic tone]` | 演劇的で、強調された強さ         |

試してみましょう:

```
[whispers] ドアのすぐ外にいる。 [rushed] 今すぐ動かないと、時間がない。 [shouts] 走れ！
```

**訛りとキャラクター**

声は変えずに訛りだけを変えるか、声にキャラクターの人格を与えます。

| タグ                        | 働き                |
| ------------------------- | ----------------- |
| `[American accent]`       | 標準的なアメリカ英語        |
| `[British accent]`        | 標準的なイギリス英語        |
| `[French accent]`         | フランス訛りの英語         |
| `[Southern US accent]`    | アメリカ南部のなまり        |
| `[Australian accent]`     | オーストラリア英語         |
| `[strong Russian accent]` | 強いロシア訛り           |
| `[strong X accent]`       | X を任意の国籍名に置き換えます  |
| `[pirate voice]`          | 荒々しい、船乗りらしいキャラクター |
| `[old man voice]`         | 年季の入った、風化した話し方    |
| `[robot voice]`           | 機械的な、合成されたトーン     |
| `[fantasy narrator]`      | 壮大な、絵本のような語り      |
| `[film noir narrator]`    | 暗く、ムーディーで、皮肉っぽい語り |
| `[sarcastically]`         | 乾いた、皮肉っぽいキャラクター読み |

試してみましょう:

```
[pirate voice] 宝は古い礼拝堂の下、深さ三尋に埋まっている。 [old man voice] この町に土の道と正直者しかいなかった頃を覚えているよ。 [robot voice] 警告。構造的完全性が損なわれています。直ちに避難してください。
```

### 複数キャラクターの会話

1 つのプロンプトで 2 人以上のキャラクターが登場する сценen を書くときは、これらを使ってセリフのやり取りを形作ります。

| タグ               | 働き               |
| ---------------- | ---------------- |
| `[interrupting]` | 相手のセリフが終わる前に割り込む |
| `[overlapping]`  | 別の声が続いている間に話し始める |

試してみましょう:

```
つまり、私が言おうとしていたのは [interrupting] いや、やめて。言い逃れはできない。 [overlapping] でも、ちょっとだけ話を聞いてくれれば...
```

### 間とテンポ

ElevenLabs は明示的な休止時間をサポートしていません。休止の長さは文脈、タグ、句読点から推測されます。

| これを書いて    | 働き                    |
| --------- | --------------------- |
| `[pause]` | 劇的な沈黙（長さはモデルが決定）      |
| `...`     | ためらいがちな、言葉尻が消えるような休止  |
| すべて大文字    | その単語を強調               |
| 新しい段落     | はっきりした間とイントネーションのリセット |

試してみましょう:

```
「I... ええ、そうだと思います。」

「[pause] そして、それが起こった。」

「今だって言っただろ！」
```

### よりよい結果を得るためのヒント

| ヒント                          | その理由                                                                                  |
| ---------------------------- | ------------------------------------------------------------------------------------- |
| タグをテキストに合わせる                 | `[crying] 行かないで。` 自然に聞こえます。 `[crying]` カジュアルな文に追加すると、そうはなりません。モデルは文脈のために行全体を読み取ります。   |
| タグを組み合わせる                    | `[whispers][tense]` または `[hesitant][nervous]` は、より繊細な出力のためにモデルへ 2 つの手がかりを与え、ブレンドさせます。 |
| 適切な声を選ぶ                      | 落ち着いた声は、説得力のある叫び方はできません。ハイエナジーな声は、うまくささやけません。役に合った声を選びましょう。                           |
| Creative または Natural の安定度を使う | これらの設定にすると、モデルがタグを表現する余地が広がります。Robust はより一貫していますが、表現力は控えめです。                          |
| 句読点をリズムの合図として使う              | カンマはテンポを遅くします。ピリオドは強い区切りを作ります。三点リーダーは言葉を引き延ばします。モデルは句読点を読み取り、それに反応します。                |

## Google Gemini 3.1 Flash TTS

Gemini 3.1 Flash TTS は、幅広い言語にわたって、トーン、テンポ、訛りを細かく制御できる、表現力豊かな多言語ナレーションを提供します。指示の出し方は 2 通りあります。自然言語の指示と、台本に直接書き込むインラインの合図です。

### 使い方

Gemini は、自然言語で書かれた指示を読み取り、それに合わせて話し方を形作ります。まず指示を書き、そのあとにセリフを書きます。

| 指示なし              | 指示あり                                         |
| ----------------- | -------------------------------------------- |
| 嵐は過ぎ去りました。もう安全です。 | 子どもをあやすように、温かくゆっくり話してください: 嵐は過ぎ去りました。もう安全です。 |

また、角括弧内のインライン合図を入れて反応を追加したり、行の途中で話し方を切り替えたりできます。Gemini はその合図を読み上げずに実行します。

試してみましょう: `そんなことをしたなんて信じられない [laughs]。今年いちばんのサプライズだよ。`

### タグ

合図は、入れたい位置にそのまま角括弧で書いてください。Gemini はそれを読み上げずに実行し、1 つの台本内で複数使うこともできます。

反応と音:

| タグ                  | 働き              |
| ------------------- | --------------- |
| \[laughs]           | 自然な笑いを追加        |
| \[laughs nervously] | 緊張した笑いを追加       |
| \[sighs]            | ため息を追加          |
| \[gasps]            | 鋭い息の吸い込みを追加     |
| \[exhales]          | 聞こえる息吐きを追加      |
| \[scoffs]           | 軽蔑するような鼻で笑う音を追加 |
| \[clears throat]    | セリフの前に咳払いを追加    |
| \[crying]           | 涙ながらにセリフを届ける    |

話し方とトーン:

| タグ              | 働き                  |
| --------------- | ------------------- |
| \[whispering]   | 声をささやき声まで落とす        |
| \[normal voice] | 通常の話し声に戻す           |
| \[softly]       | 話し方をやわらかくする         |
| \[shouting]     | 声を張り上げる             |
| \[slowly]       | テンポを遅くする            |
| \[excited]      | 活力と高揚感を加える          |
| \[nervously]    | 緊張した、ためらいがちなトーンを加える |

試してみましょう: `[whispering] 音を立てないで。 [normal voice] よし、クリアだ。`

トーン、エネルギー、訛りについては、セリフの前に自然な言葉で欲しいものを説明してください。Gemini は対応言語全体で訛りの制御をサポートしています。

試してみましょう: `英国訛りでこれを読んでください: いいお天気ですね？`

### 複数話者の会話

Gemini は 1 回の生成で 2 人の話者による掛け合いを音声化でき、それぞれに異なる声を割り当てられます。生成する前に、各セリフに話者名を付け、各話者に声を割り当ててください。Gemini は 1 つの会話につき最大 2 人の話者をサポートします。

試してみましょう:

```
Maya: 仕事の返事、来た？
Tom: 来たよ。月曜から始める。
Maya: すごい、おめでとう。
```

| 要素     | やること                         |
| ------ | ---------------------------- |
| 話者ラベル  | 各行を、話者名の後にコロンを付けて始める         |
| 話者ごとの声 | 生成前に、名前のある各話者へそれぞれ専用の声を割り当てる |
| 話者数の上限 | 1 つの会話につき、最大 2 人までの異なる話者     |

### 間とテンポ

三点リーダーを使うと少しの無音を加えられます。さらに、指示で欲しいテンポを指定してください。

| 方法         | 例                                  |
| ---------- | ---------------------------------- |
| 休止用の三点リーダー | `待って... ... ... 聞こえた？`             |
| 指示でテンポを指定  | `ゆっくり、はっきり読んでください: すべて。の。言葉。が。大事。` |

### よりよい結果を得るためのヒント

| ヒント         | 役立つ理由                                         |
| ----------- | --------------------------------------------- |
| セリフの前に指示を書く | Gemini は、その後に続くテキストへ指示を適用します                  |
| 場面設定をする     | たとえば、 `自然ドキュメンタリーを、落ち着いた小声で語る:` トーンと話し方を形作ります |
| 方法を組み合わせる   | 自然な言葉の指示と、同じ台本内の角括弧の合図を組み合わせます                |
| 言語を声に合わせる   | 生成する前に、台本に合う声と言語を選びます                         |

## MiniMax

MiniMax は **括弧付きの音声タグ** をプロンプト内で使用し、別個の **感情セレクター** を Morphic の UI で使います。

### 感情

生成時にドロップダウンから感情を選択します。これにより、出力全体のトーンが決まります。

| 感情        | 効果                              |
| --------- | ------------------------------- |
| Auto      | モデルがテキストを読み、最適な感情を選びます（既定）      |
| Happy     | 前向きで明るい                         |
| Sad       | 沈んだ、憂うつな                        |
| Angry     | 力強く、攻撃的                         |
| Fearful   | 不安で、怖がっている                      |
| Disgusted | 不快感があり、嫌悪している                   |
| Surprised | 驚いた、びっくりした                      |
| Calm      | 落ち着いた、穏やかな                      |
| Fluent    | きれいな放送風の話し方 — ニュースや技術系ナレーションに最適 |
| Neutral   | 感情の偏りなし                         |

### 音声タグ

括弧を使って、言葉以外の音をプロンプトに直接追加します。これは **プリセットのみ** で、以下に挙げるタグだけがサポートされています。

```
信じられないくらいすごい (laughs) 本当に動いたなんて信じられない。
結果は... 予想外でした。 (sighs) 説明します。
```

| タグ          | タグ         | タグ         |
| ----------- | ---------- | ---------- |
| `(笑い)`      | `(くすくす笑い)` | `(咳)`      |
| `(咳払い)`     | `(うめき声)`   | `(息)`      |
| `(息を切らす)`   | `(吸う)`     | `(吐く)`     |
| `(はっと息をのむ)` | `(鼻をすする)`  | `(ため息)`    |
| `(鼻を鳴らす)`   | `(げっぷ)`    | `(くちゃくちゃ)` |
| `(ハミング)`    | `(シーッ)`    | `(えーと)`    |
| `(口笛)`      | `(くしゃみ)`   | `(泣き)`     |
| `(拍手)`      | `(あくび)`    |            |

> ElevenLabsとは異なり、あなたは **できません** カスタムタグを作成できます。記述しても `(緊張)` または `(嫉妬)` は機能しません — モデルはそれをテキストとして読み上げます。感情のニュアンスには感情セレクターを使ってください。

### ポーズ

時間指定の無音を次の形式で挿入します `<#x#>` ここで `x` は秒単位です（0.01～99.99）。

```
結果は予想外でした。 <#1.2#> なぜそうなったのか見ていきましょう。
話があります。 <#0.5#> 重要なことです。
```

### ヒント

* サウンドタグは控えめに使いましょう — 多すぎると不自然に聞こえます。
* 感情を次のように設定します **Auto** ほとんどの場合はこれで十分です。長文全体で一貫したトーンが必要なときは手動で上書きしてください。
* 句読点は重要です — カンマとピリオドがモデルの間合いとイントネーションを導きます。


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://morphic.com/docs/jp/dio/voice-emotion-control.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
