视频生成
Bernini
由 ByteDance 提供
字节跳动开源视频模型。
基于指令编辑,保留主体身份。

核心功能
Bernini 与其他 AI 模型的不同之处
技术规格
关键规格和功能一览
Planner + DiT
Qwen2.5-VL 规划器,14B Wan2.2 渲染器
Edit, Generate, R2V
编辑、生成、主体到视频
480p / 16fps
默认渲染设置
Apache 2.0
开源权重,可自托管
应用场景
创作者和企业如何在 Morphic 上使用 Bernini
增强实拍素材
无需重拍即可在片段中添加或移除道具、修正某个细节,或重新风格化某个元素。一致性锁定让镜头其余部分保持一致,编辑看起来浑然天成。
复现角色与数字人
在多集内容、广告或数字人系列中保持同一张面孔。主体到视频能从几张参考图保留人物身份,让其穿行于新场景之中。
虚拟试穿与产品植入
依据参考图将服装换到运动中的模特身上,或将产品或屏幕内视频置入镜头,用于需要保留源片段的时尚与广告制作。
重新设计动作
改变某人在一条镜头中正在做的事,例如从站立变为蹲下,而无需重拍。动作编辑改变行为,同时身份、构图和光照保持固定。
提示词示例
打开任意提示词进行编辑并生成
简单定价
今天就免费开始,随时可以升级或取消。
Basic
900 每月 信用
1 个用户
所有模型
工作流
Standard
3200 每月 信用
1 个用户
所有模型
工作流
Pro
6200 共享 每月 信用
1 用户
+ 最多 4 人额外付费可增加
所有模型
工作流
Pro Max
24000 共享 每月 信用
1 用户
+ 最多 9 人额外付费可增加
所有模型
工作流
Enterprise
更高的限制
自定义
定价和账单条款
无限信用
自定义席位限制
所有模型
工作流

Free
For playing around
$0
forever free
最多 20 积分
仅1个用户
部分模型
工作流
常见问题
Bernini 是什么?
Bernini 是字节跳动用于视频生成与编辑的开源统一框架。它将基于 MLLM 的语义规划器与基于 DiT、构建于 Wan2.2 之上的渲染器相结合,于 2026 年 6 月以 Apache 2.0 协议发布。
Bernini 能做什么?
它支持文本到图像、图像编辑、文本到视频、基于指令的视频编辑、参考引导编辑(如服装替换与视频插入),以及将人物或角色置入新场景的主体到视频。
Bernini 与标准视频模型有何不同?
大多数视频模型从零生成。Bernini 将工作拆分:MLLM 规划器决定语义,渲染器再绘制像素。这种设计带来了强大的编辑一致性,片段中未改动的部分保持冻结,以及主体到视频中强大的身份保留。
Bernini 是开源的吗?
是的。推理代码和渲染器权重以 Apache 2.0 协议公开发布在 GitHub 和 Hugging Face 上。你可以在自己的硬件上运行;建议使用 Hopper 级 GPU,视频则建议使用多块 GPU。
Bernini 保留主体身份的效果如何?
身份保留是它的突出表现。在 ByteDance 的 subject-to-video 评测中,它在面部相似度上领先于同类系统,在主体移动时保持可辨认的面孔,因此适合数字人、角色制作以及需要同一张面孔反复出现的连续剧集内容。
Bernini 输出什么分辨率?
默认渲染设置为 480p / 16fps。该版本将编辑保真度和一致性置于最高分辨率之上,更高的设置在更大算力成本下也可实现。
进一步了解 Bernini
Bernini 的指南、提示词与对比。