音声生成
利用可能

Gemini 3.1 Flash TTS

Google DeepMind 提供

Googleで最も表現豊かなテキスト読み上げ。オーディオタグとマルチスピーカー会話に対応。

Gemini 3.1 Flash TTS

主な機能

技術仕様

多言語

多くの言語でスタイル・速度・アクセントを制御

最大2人

1回のマルチスピーカー生成で2つの異なる声

音声タグ

自然な言葉の指示とインラインの角括弧タグ

SynthID

出力に付与される知覚できないAI出所ウォーターマーク

活用事例

動画ナレーションとボイスオーバー

AIや実写の動画に自然なナレーションを追加。トーンや速度は普通の言葉で指定できます。

キャラクターの対話

ショート、ゲーム、解説向けに2人の話者のシーンを声に。各キャラクターに固有の声を割り当てます。

ローカライズされたボイスオーバー

同じ台本を多くの言語で、ネイティブな速度とアクセントでナレーションします。

オーディオブックと長尺コンテンツ

長いナレーションでも自然で一貫した読み上げを維持します。

解説とチュートリアル

製品ウォークスルー、レッスン、ハウツー向けの明瞭で演出可能なナレーション。

広告ナレーションとプロモ

あなたが演出するエネルギーと強調で、表現豊かでブランドに沿った読み上げを。

プロンプト例

やさしいナレーション

これをやさしくゆっくり、子どもをなだめるように言って:嵐は過ぎ去った。もう安全だよ。

Edit prompt

インラインの反応

まさかそんなことをするなんて [laughs]。今年いちばんのサプライズだ。

Edit prompt

ささやきから通常へ

[whispering] 物音を立てないで。[normal voice] よし、もう大丈夫。

Edit prompt

アクセント制御

これをイギリス英語のアクセントで読んで:Lovely weather we're having, isn't it?

Edit prompt

ドラマチックな間

これをゆっくり、はっきりと読んで:すべての。言葉が。重要。

Edit prompt

2人の話者のシーン

Maya: 仕事の連絡あった? Tom: あったよ。月曜から始める。

Edit prompt

シンプルな料金体系

今すぐ無料で始めて、いつでもアップグレードまたはキャンセルできます。

Basic

$0/
請求額は $0

500 月 クレジット

1 ユーザーのみ

すべてのモデル

ワークフロー

Standard

$0/
請求額は $0

2800 月 クレジット

1 ユーザーのみ

すべてのモデル

ワークフロー

Pro

$0/
請求額は $0

6000 共有 月 クレジット

1 ユーザー

+ 最大 4 名まで追加費用

すべてのモデル

ワークフロー

Pro Max

$0/
請求額は $0

24000 共有 月 クレジット

1 ユーザー

+ 最大 9 名まで追加費用

すべてのモデル

ワークフロー

Enterprise

より高い制限のために

カスタム

料金と請求条件

無制限クレジット
カスタムシート制限
すべてのモデル
ワークフロー
Pricing Gradient

Free

For playing around

$0

forever free

最大20クレジット
1ユーザーのみ
一部のモデル
ワークフロー

よくある質問

Gemini 3.1 Flash TTSとは何ですか?
Gemini 3.1 Flash TTSはGoogleのテキスト読み上げモデルで、2026年4月15日に発表されました。普通の言葉による指示とインラインのオーディオタグで演出できる、表現豊かで自然なナレーションを生成し、マルチスピーカー会話に対応し、すべてのクリップにSynthIDウォーターマークを付与します。
Morphicで何を作れますか?
Gemini 3.1 Flash TTSはボイスオーバー、ナレーション、キャラクターの対話、ローカライズされた読み上げ、表現豊かな広告ナレーションに使えます。Morphicで音声を生成し、同じワークフロー内でCanvasの動画クリップの隣に配置できます。
声をどうやって演出しますか?
方法は2つあり、組み合わせも可能です。ラインの前に「これをやさしくゆっくり:」のような普通の言葉の指示を書き、[laughs] や [whispering] のような角括弧の指示を好きな位置に追加します。Geminiは読み上げる代わりにその演技を実行します。
複数の話者に対応していますか?
はい。Gemini 3.1 Flash TTSは1回の生成で2人の話者のやり取りを声にでき、それぞれに異なる声を割り当てます。各ラインに話者の名前を付け、生成前にそれぞれへ声を割り当てます。
いくつの言語に対応していますか?
Gemini 3.1 Flash TTSは多くの言語でナレーションし、それぞれでアクセント・速度・スタイルを制御できます。生成前に台本に合った声と言語を選んでください。
MorphicのElevenLabsとどう違いますか?
どちらもMorphicで人間品質の声を生成します。ElevenLabsは音声・音楽・効果音をカバーし、きめ細かな声の調整ができる総合オーディオスイートです。Gemini 3.1 Flash TTSは表現豊かで演出可能な発話に特化し、普通の言葉による演出、インラインのオーディオタグ、マルチスピーカー会話を備えます。多くのクリエイターは、片方を声に、もう片方を音楽や効果音にと、両方を使い分けます。
音声にウォーターマークは付きますか?
はい。Gemini 3.1 Flash TTSで生成されたすべてのクリップには、AI出所を示すGoogleの知覚できないSynthIDウォーターマークが付与されます。聴き手には聞こえず、再エンコードのような一般的な編集にも耐えます。
MorphicでGemini 3.1 Flash TTSをどう使いますか?
Morphicを開き、プロンプトバーをAudioに切り替えてSpeechを選びます。オーディオモデルとしてGemini 3.1 Flash TTSを選び、演出やタグを入れた台本を書き、声と言語を選んで生成します。