Gemini 3.1 Flash TTS
Google DeepMind 提供
Googleで最も表現豊かなテキスト読み上げ。オーディオタグとマルチスピーカー会話に対応。

主な機能
技術仕様
多言語
多くの言語でスタイル・速度・アクセントを制御
最大2人
1回のマルチスピーカー生成で2つの異なる声
音声タグ
自然な言葉の指示とインラインの角括弧タグ
SynthID
出力に付与される知覚できないAI出所ウォーターマーク
活用事例
動画ナレーションとボイスオーバー
AIや実写の動画に自然なナレーションを追加。トーンや速度は普通の言葉で指定できます。
キャラクターの対話
ショート、ゲーム、解説向けに2人の話者のシーンを声に。各キャラクターに固有の声を割り当てます。
ローカライズされたボイスオーバー
同じ台本を多くの言語で、ネイティブな速度とアクセントでナレーションします。
オーディオブックと長尺コンテンツ
長いナレーションでも自然で一貫した読み上げを維持します。
解説とチュートリアル
製品ウォークスルー、レッスン、ハウツー向けの明瞭で演出可能なナレーション。
広告ナレーションとプロモ
あなたが演出するエネルギーと強調で、表現豊かでブランドに沿った読み上げを。
プロンプト例
シンプルな料金体系
今すぐ無料で始めて、いつでもアップグレードまたはキャンセルできます。
Basic
500 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Standard
2800 月 クレジット
1 ユーザーのみ
すべてのモデル
ワークフロー
Pro
6000 共有 月 クレジット
1 ユーザー
すべてのモデル
ワークフロー
Pro Max
24000 共有 月 クレジット
1 ユーザー
すべてのモデル
ワークフロー
Enterprise
より高い制限のために
カスタム
料金と請求条件

Free
For playing around
$0
forever free
よくある質問
その他のモデル
Morphicのモデルカタログをさらに見る。
Ideogram 4.0
Ideogram
Ideogramのオープンウェイト画像モデル。画像内テキスト、レイアウト制御、2K出力。
Reve 2.0
Reve AI
Reve AIのレイアウト優先の画像モデル。すべての要素を手作業で配置し、結果をデザインファイルのように編集し、最大4Kで鮮明なテキストを描画する。
Bernini
ByteDance
指示ベースの編集に対応したByteDanceのオープンソース動画モデル。フレームの他の部分は固定され、被写体の同一性も保たれる。
Grok Imagine v1.5
xAI
ネイティブの同期音声を備えたxAIの画像から動画モデル。あらゆる静止画を、音、セリフ、音楽付きのクリップにアニメート。