Question 1

Seed Audio 1.0 の T2A と TA2A は何が違いますか？

Accepted Answer

T2A（テキストから音声）は、環境、音楽、効果音、各人物の声まで、すべてを説明から組み立てます。TA2A（テキスト＋音声から音声）はそこに参照録音を3本まで加え、特定の人物に紐づけます。紐づけた声は文章の説明ではなく録音に従います。プロンプトのそれ以外の書き方は同じです。

Question 2

Seed Audio 1.0 は声をクローンできますか？

Accepted Answer

はい。T2AとTA2Aのほかに音声クローンのモードがあります。音声クリップを1本アップロードすると、クローンされた声が通常の音声合成で使えるようになります。ByteDanceは1本のクリップからのクローンとして記載しています。その声を音楽や効果音、ほかの話者と一緒に1つのシーンの中で鳴らす必要があるなら、参照クリップを3本まで受け取り、それぞれを人物に紐づけられる TA2A を使ってください。

Question 3

Seed Audio 1.0 のタイム制御はどう動きますか？

Accepted Answer

セリフの先頭に [5.5s:8.0s] の形でタイムスタンプを置くと、モデルは速度と間を調整して、その演技をぴたりとその区間に収めます。音を絵に合わせる必要のある吹き替えで、このモデルを実用的にしているのがこの機能です。タイムスタンプのないセリフは自然なテンポで読まれます。

Question 4

Seed Audio 1.0 はどの言語に対応していますか？

Accepted Answer

20言語です。英語、中国語、日本語、韓国語、メキシコスペイン語、カスティーリャスペイン語、インドネシア語、ドイツ語、ブラジルポルトガル語、フランス語、タイ語、ベトナム語、マレー語、フィリピン語、イタリア語、ロシア語、オランダ語、ポーランド語、トルコ語、スウェーデン語。台本と同じ言語でプロンプトを書くと、結果が最も安定します。

Question 5

Seed Audio 1.0 は複数の話者を同時に生成できますか？

Accepted Answer

はい。シーンを書きながら各人物の声を説明すれば、モデルは1回の生成で話者ごとに異なる声・感情・テンポを与え、周囲の環境音や効果音も一緒に作ります。TA2A モードでは、そのうち3人までを参照録音に紐づけられます。

Question 6

Seed Audio 1.0 の生成はどれくらいの長さになりますか？

Accepted Answer

1回あたり最大2分の音声で、プロンプトは最大3,000文字です。生成は非ストリーミングで、モデルは音声をリアルタイムに返すのではなく、ミックス済みの完成トラックをレンダリングします。それより長い作品はシーンごとに作ります。

Question 7

Seed Audio 1.0 でオーディオブックのナレーションはできますか？

Accepted Answer

このモデルが最も力を発揮する使い方のひとつです。1つのプロンプトで語り手の声、登場人物の声、その周りの音響までまかなえるので、シーンはミックス待ちの別トラックではなく、仕上がった状態で届きます。章をまたいで同じ音声参照を使えば、語り手は1冊を通して変わりません。

Question 8

Seed Audio 1.0 は通常の音声合成と違いますか？

Accepted Answer

大きく違います。通常の音声合成は声を選んでテキストを読み上げます。Seed Audio 1.0 はテキストから音声へ、さらに参照から音声へと進みます。1つのプロンプトで環境、音楽、効果音、各人物の声を説明すると、モデルはシーン全体をミックスした状態で返します。範囲の違いは、声だけか、完成した音声作品まるごとか、です。

SCENE	含めるもの	例
シーン	天気、場所、状況、音響	放課後の廊下、遠くの足音、反響
配役	各人物の動作や身なり	リュックを肩に、ドアから手を振る
効果音と音楽	音楽の雰囲気やジャンル、効果音	低い戦太鼓、重い金管、ロッカーの「カチャン」
声のメモ	性別、年齢、なまり、感情、声色、速さ	十代の男子、米国なまり、明るく強気な声
セリフ	各人物が話す言葉、かぎ括弧で	「エマ、土曜って空いてる？」

Seed Audio 1.0: 完全ガイド

ドキュメンタリーのナレーション

スリラーのボイスオーバー

スパイス市場のアンビエンス

雷雨

オーケストラのキュー

ローファイビート

Seed Audio 1.0 の活用例

動画音声を一度に生成

解説動画とチュートリアル

短い広告とプロモ

脚本のある対話とオーディオドラマ

オーディオブックと長尺ナレーション

フレーム単位で合う吹き替え

Seed Audio 1.0 のプロンプトの書き方

秒単位でタイミングを制御する

参照音声から声をキャスティングする（TA2A）

Seed Audio 1.0 の使い方

よくある質問

Seed Audio 1.0 を聴く