视频生成

Bernini

由 ByteDance 提供

字节跳动的开源视频模型,用于基于指令的编辑,画面其余部分保持不变,主体身份得以保留。

视频编辑主体到视频参考引导编辑文本到视频文本到图像
Bernini

核心功能

Bernini 与其他 AI 模型的不同之处

技术规格

关键规格和功能一览

Planner + DiT

Qwen2.5-VL 规划器,14B Wan2.2 渲染器

Edit, Generate, R2V

编辑、生成、主体到视频

480p / 16fps

默认渲染设置

Apache 2.0

开源权重,可自托管

应用场景

创作者和企业如何在 Morphic 上使用 Bernini

增强实拍素材

无需重拍即可在片段中添加或移除道具、修正某个细节,或重新风格化某个元素。一致性锁定让镜头其余部分保持一致,编辑看起来浑然天成。

复现角色与数字人

在多集内容、广告或数字人系列中保持同一张面孔。主体到视频能从几张参考图保留人物身份,让其穿行于新场景之中。

虚拟试穿与产品植入

依据参考图将服装换到运动中的模特身上,或将产品或屏幕内视频置入镜头,用于需要保留源片段的时尚与广告制作。

重新设计动作

改变某人在一条镜头中正在做的事,例如从站立变为蹲下,而无需重拍。动作编辑改变行为,同时身份、构图和光照保持固定。

提示词示例

打开任意提示词进行编辑并生成

一致性编辑

在雪地小路上的狗旁边加一个雪人,并让狗、道路和树木保持不变

Edit prompt

锁定身份的主体

将这个人置于夜晚的霓虹城市天台,缓缓转向镜头,保留其面部和夹克

Edit prompt

参考替换

将外衣换成参考图中的那件,姿态、光照和动作完全保持不变

Edit prompt

简单定价

今天就免费开始,随时可以升级或取消。

Basic

$0/
账单金额为 $0 每年

500 每月 信用

1 个用户

所有模型

工作流

Standard

$0/
账单金额为 $0 每年

2800 每月 信用

1 个用户

所有模型

工作流

Pro

$0/
账单金额为 $0 每年

6000 共享 每月 信用

1 用户

+ 最多 4 人额外付费可增加

所有模型

工作流

Pro Max

$0/
账单金额为 $0 每年

24000 共享 每月 信用

1 用户

+ 最多 9 人额外付费可增加

所有模型

工作流

Enterprise

更高的限制

自定义

定价和账单条款

无限信用
自定义席位限制
所有模型
工作流
Pricing Gradient

Free

For playing around

$0

forever free

最多 20 积分
仅1个用户
部分模型
工作流

常见问题

Bernini 是什么?
Bernini 是字节跳动用于视频生成与编辑的开源统一框架。它将基于 MLLM 的语义规划器与基于 DiT、构建于 Wan2.2 之上的渲染器相结合,于 2026 年 6 月以 Apache 2.0 协议发布。
Bernini 能做什么?
它支持文本到图像、图像编辑、文本到视频、基于指令的视频编辑、参考引导编辑(如服装替换与视频插入),以及将人物或角色置入新场景的主体到视频。
Bernini 与标准视频模型有何不同?
大多数视频模型从零生成。Bernini 将工作拆分:MLLM 规划器决定语义,渲染器再绘制像素。这种设计带来了强大的编辑一致性,片段中未改动的部分保持冻结,以及主体到视频中强大的身份保留。
Bernini 是开源的吗?
是的。推理代码和渲染器权重以 Apache 2.0 协议公开发布在 GitHub 和 Hugging Face 上。你可以在自己的硬件上运行;建议使用 Hopper 级 GPU,视频则建议使用多块 GPU。
Bernini 保留主体身份的效果如何?
身份保留是它的突出表现。在 ByteDance 的 subject-to-video 评测中,它在面部相似度上领先于同类系统,在主体移动时保持可辨认的面孔,因此适合数字人、角色制作以及需要同一张面孔反复出现的连续剧集内容。
Bernini 输出什么分辨率?
默认渲染设置为 480p / 16fps。该版本将编辑保真度和一致性置于最高分辨率之上,更高的设置在更大算力成本下也可实现。

在 Morphic 上 Bernini 试用

注册 Morphic,开始使用 Bernini 进行创作。无需下载,无需设置,只需描述您的想法即可生成。