音频生成

Seed Audio 1.0

由 ByteDance 提供

字节跳动的新一代音频模型。
语音、音效与音乐,一次生成。

Seed Audio 1.0

核心功能

以下是 Seed Audio 1.0 上将提供的预期功能。

聆听声音的广度

语音、音效与音乐,一次生成。

纪录片旁白语音

温暖、沉稳的纪录片旁白。

0:00
0:12
惊悚片旁白语音

压低、紧张的台词朗读,贴近而私密。

0:00
0:12
香料市场环境声音效

层次丰富的露天市场声音铺底。

0:00
0:12
雷暴音效

翻滚的风暴逐渐积累至一声远雷。

0:00
0:12
管弦乐段音乐

一段为弦乐与铜管而作的短促上扬乐句。

0:00
0:12
Lo-fi 节拍音乐

一段放松的节拍,配柔和的键盘和黑胶的噼啪声。

0:00
0:12

技术规格

即将推出

已公布,预计很快推出,尚未发布。

Beta in 2026

预计 2026 年开放早期测试。

一体化

语音、音效和音乐在一次生成中同时产出。

超越 TTS

超越文本转语音,迈向完整的场景音频。

Seed 系列

基于 Seed-Music 和 Seed Speech 2 构建。

一次跃迁

相比常规配音工具的一次飞跃。

应用场景

一次生成的视频音频

一次生成为片段配上旁白、音效和配乐,无需单独的混音步骤。

旁白讲解片

一次输出包含语音加上轻量的环境声和音乐,适合以人声为主的讲解和教程片。

广告与推广片

一句台词、几处音效和一段音乐铺底融为一个声景,专为短广告和推广片而设。

播客与广播剧

对白配上匹配的环境声和点缀音,让广播剧和有脚本的播客片段更有身临其境之感。

游戏与界面音效草稿

在定制音效设计之前,为游戏瞬间或界面快速生成组合音频草稿:人声、音效和氛围。

社交短片

制作大量短视频的创作者一步生成贴合的音频,而无需四处寻找素材片段和音轨。

提示词示例

旁白讲解片

平静的旁白叠在柔和的房间底噪上,逐步讲解一道简单食谱

Edit prompt

广告声景

活力的台词、一声呼啸,以及一段明亮短促的音乐铺底,用于运动鞋广告

Edit prompt

广播剧片段

两个角色在繁忙的咖啡馆争执,底下是碗碟碰撞声和交谈声

Edit prompt

游戏瞬间

一扇沉重的门吱呀开向洞穴,低沉的轰鸣,一声孤零零的滴水回响

Edit prompt

社交短片

有冲击力的旁白配上利落的转场音和轻快的背景节拍

Edit prompt

场景环境声

黎明时分静谧的森林,鸟鸣渐起,底下是一段轻柔的弦乐铺底

Edit prompt

简单定价

今天就免费开始,随时可以升级或取消。

Basic

$0/
账单金额为 $0 每年

900 每月 信用

1 个用户

所有模型

工作流

Standard

$0/
账单金额为 $0 每年

3200 每月 信用

1 个用户

所有模型

工作流

Pro

$0/
账单金额为 $0 每年

6200 共享 每月 信用

1 用户

+ 最多 4 人额外付费可增加

所有模型

工作流

Pro Max

$0/
账单金额为 $0 每年

24000 共享 每月 信用

1 用户

+ 最多 9 人额外付费可增加

所有模型

工作流

Enterprise

更高的限制

自定义

定价和账单条款

无限信用
自定义席位限制
所有模型
工作流
Pricing Gradient

Free

For playing around

$0

forever free

最多 20 积分
仅1个用户
部分模型
工作流

常见问题

Seed Audio 1.0 是什么?
Seed Audio 1.0 是字节跳动即将推出的一体化音频模型。它超越传统的文本转语音,在一次输出中同时生成语音、音效和背景音乐,基于字节跳动的 Seed-Music 和 Seed Speech 工作构建。预计 2026 年开放早期测试。
Seed Audio 1.0 什么时候发布?
Seed Audio 1.0 的早期测试预计在 2026 年。作为一款即将发布的模型,在字节跳动正式上线前时间可能调整。
Seed Audio 1.0 与文本转语音有何不同?
单纯的文本转语音把文字变成一段人声。Seed Audio 1.0 则在一次生成中产出整个声景:说出的台词加上音效和背景音乐。差别在于范围:一个完整的声音场景,而不仅是人声。
Seed Audio 1.0 基于什么构建?
Seed Audio 1.0 建立在字节跳动已有的音频工作之上:Seed-Music 生成系统、以自然、多语言、可控情感的语音著称的 Seed Speech 2 系列,以及 Seedance 视频中的原生音频,将它们汇聚到一个模型中。
Seed Audio 1.0 适合做什么?
最契合的是为视频配音频:一次生成同时为片段配上旁白、音效和音乐。这适合广告、讲解片、社交短片和广播剧,因为分别寻找和混音音轨正是其中最慢的环节。