音声生成
利用可能
Gemini 3.1 Flash TTS
Google DeepMind 提供
Googleで最も表現豊かなテキスト読み上げ。
オーディオタグとマルチスピーカー会話に対応。

主な機能
技術仕様
多言語
多くの言語でスタイル・速度・アクセントを制御
最大2人
1回のマルチスピーカー生成で2つの異なる声
音声タグ
自然な言葉の指示とインラインの角括弧タグ
SynthID
出力に付与される知覚できないAI出所ウォーターマーク
活用事例
動画ナレーションとボイスオーバー
AIや実写の動画に自然なナレーションを追加。トーンや速度は普通の言葉で指定できます。
キャラクターの対話
ショート、ゲーム、解説向けに2人の話者のシーンを声に。各キャラクターに固有の声を割り当てます。
ローカライズされたボイスオーバー
同じ台本を多くの言語で、ネイティブな速度とアクセントでナレーションします。
オーディオブックと長尺コンテンツ
長いナレーションでも自然で一貫した読み上げを維持します。
解説とチュートリアル
製品ウォークスルー、レッスン、ハウツー向けの明瞭で演出可能なナレーション。
広告ナレーションとプロモ
あなたが演出するエネルギーと強調で、表現豊かでブランドに沿った読み上げを。
プロンプト例
シンプルな料金体系
今すぐ無料で始めて、いつでもアップグレードまたはキャンセルできます。
Basic
900 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Standard
3200 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Pro
6200 共有 月 クレジット
1 ユーザー
+ 最大 4 名まで追加費用
すべてのモデル
ワークフロー
Pro Max
24000 共有 月 クレジット
1 ユーザー
+ 最大 9 名まで追加費用
すべてのモデル
ワークフロー
Enterprise
より高い制限のために
カスタム
料金と請求条件
無制限クレジット
カスタムシート制限
すべてのモデル
ワークフロー

Free
For playing around
$0
forever free
最大20クレジット
1ユーザーのみ
一部のモデル
ワークフロー
よくある質問
Gemini 3.1 Flash TTSとは何ですか?
Gemini 3.1 Flash TTSはGoogleのテキスト読み上げモデルで、2026年4月15日に発表されました。普通の言葉による指示とインラインのオーディオタグで演出できる、表現豊かで自然なナレーションを生成し、マルチスピーカー会話に対応し、すべてのクリップにSynthIDウォーターマークを付与します。
Morphicで何を作れますか?
Gemini 3.1 Flash TTSはボイスオーバー、ナレーション、キャラクターの対話、ローカライズされた読み上げ、表現豊かな広告ナレーションに使えます。Morphicで音声を生成し、同じワークフロー内でCanvasの動画クリップの隣に配置できます。
声をどうやって演出しますか?
方法は2つあり、組み合わせも可能です。ラインの前に「これをやさしくゆっくり:」のような普通の言葉の指示を書き、[laughs] や [whispering] のような角括弧の指示を好きな位置に追加します。Geminiは読み上げる代わりにその演技を実行します。
複数の話者に対応していますか?
はい。Gemini 3.1 Flash TTSは1回の生成で2人の話者のやり取りを声にでき、それぞれに異なる声を割り当てます。各ラインに話者の名前を付け、生成前にそれぞれへ声を割り当てます。
いくつの言語に対応していますか?
Gemini 3.1 Flash TTSは多くの言語でナレーションし、それぞれでアクセント・速度・スタイルを制御できます。生成前に台本に合った声と言語を選んでください。
MorphicのElevenLabsとどう違いますか?
どちらもMorphicで人間品質の声を生成します。ElevenLabsは音声・音楽・効果音をカバーし、きめ細かな声の調整ができる総合オーディオスイートです。Gemini 3.1 Flash TTSは表現豊かで演出可能な発話に特化し、普通の言葉による演出、インラインのオーディオタグ、マルチスピーカー会話を備えます。多くのクリエイターは、片方を声に、もう片方を音楽や効果音にと、両方を使い分けます。
音声にウォーターマークは付きますか?
はい。Gemini 3.1 Flash TTSで生成されたすべてのクリップには、AI出所を示すGoogleの知覚できないSynthIDウォーターマークが付与されます。聴き手には聞こえず、再エンコードのような一般的な編集にも耐えます。
MorphicでGemini 3.1 Flash TTSをどう使いますか?
Morphicを開き、プロンプトバーをAudioに切り替えてSpeechを選びます。オーディオモデルとしてGemini 3.1 Flash TTSを選び、演出やタグを入れた台本を書き、声と言語を選んで生成します。