音频生成
Seed Audio 1.0
由 ByteDance 提供
字节跳动的新一代音频模型。
语音、音效与音乐,一次生成。

核心功能
以下是 Seed Audio 1.0 上将提供的预期功能。
聆听声音的广度
语音、音效与音乐,一次生成。
纪录片旁白语音
温暖、沉稳的纪录片旁白。
0:00
0:12
惊悚片旁白语音
压低、紧张的台词朗读,贴近而私密。
0:00
0:12
香料市场环境声音效
层次丰富的露天市场声音铺底。
0:00
0:12
雷暴音效
翻滚的风暴逐渐积累至一声远雷。
0:00
0:12
管弦乐段音乐
一段为弦乐与铜管而作的短促上扬乐句。
0:00
0:12
Lo-fi 节拍音乐
一段放松的节拍,配柔和的键盘和黑胶的噼啪声。
0:00
0:12
技术规格
即将推出
已公布,预计很快推出,尚未发布。
Beta in 2026
预计 2026 年开放早期测试。
一体化
语音、音效和音乐在一次生成中同时产出。
超越 TTS
超越文本转语音,迈向完整的场景音频。
Seed 系列
基于 Seed-Music 和 Seed Speech 2 构建。
一次跃迁
相比常规配音工具的一次飞跃。
应用场景
一次生成的视频音频
一次生成为片段配上旁白、音效和配乐,无需单独的混音步骤。
旁白讲解片
一次输出包含语音加上轻量的环境声和音乐,适合以人声为主的讲解和教程片。
广告与推广片
一句台词、几处音效和一段音乐铺底融为一个声景,专为短广告和推广片而设。
播客与广播剧
对白配上匹配的环境声和点缀音,让广播剧和有脚本的播客片段更有身临其境之感。
游戏与界面音效草稿
在定制音效设计之前,为游戏瞬间或界面快速生成组合音频草稿:人声、音效和氛围。
社交短片
制作大量短视频的创作者一步生成贴合的音频,而无需四处寻找素材片段和音轨。
提示词示例
简单定价
今天就免费开始,随时可以升级或取消。
Basic
900 每月 信用
1 个用户
所有模型
工作流
Standard
3200 每月 信用
1 个用户
所有模型
工作流
Pro
6200 共享 每月 信用
1 用户
+ 最多 4 人额外付费可增加
所有模型
工作流
Pro Max
24000 共享 每月 信用
1 用户
+ 最多 9 人额外付费可增加
所有模型
工作流
Enterprise
更高的限制
自定义
定价和账单条款
无限信用
自定义席位限制
所有模型
工作流

Free
For playing around
$0
forever free
最多 20 积分
仅1个用户
部分模型
工作流
常见问题
Seed Audio 1.0 是什么?
Seed Audio 1.0 是字节跳动即将推出的一体化音频模型。它超越传统的文本转语音,在一次输出中同时生成语音、音效和背景音乐,基于字节跳动的 Seed-Music 和 Seed Speech 工作构建。预计 2026 年开放早期测试。
Seed Audio 1.0 什么时候发布?
Seed Audio 1.0 的早期测试预计在 2026 年。作为一款即将发布的模型,在字节跳动正式上线前时间可能调整。
Seed Audio 1.0 与文本转语音有何不同?
单纯的文本转语音把文字变成一段人声。Seed Audio 1.0 则在一次生成中产出整个声景:说出的台词加上音效和背景音乐。差别在于范围:一个完整的声音场景,而不仅是人声。
Seed Audio 1.0 基于什么构建?
Seed Audio 1.0 建立在字节跳动已有的音频工作之上:Seed-Music 生成系统、以自然、多语言、可控情感的语音著称的 Seed Speech 2 系列,以及 Seedance 视频中的原生音频,将它们汇聚到一个模型中。
Seed Audio 1.0 适合做什么?
最契合的是为视频配音频:一次生成同时为片段配上旁白、音效和音乐。这适合广告、讲解片、社交短片和广播剧,因为分别寻找和混音音轨正是其中最慢的环节。