可灵 3.0
可灵 3.0是什么?
可灵 3.0 可以生成完整的迷你影片序列:包含多个不同相机镜头、连续的角色和匹配的声音,全部来自单一提示,使其成为 2026 年初最强大的 AI 视频导演。
一图看懂
- Type of model
- 统一的多模态文生视频、图生视频与音视频生成式 AI 模型
- Developed by
- 快手科技(Kuaishou Technology)
- Key capability
- 最多 6 个镜头切换的多镜头分镜、统一多模态输入(文本、图像、音频、视频)、4K 输出、多语言原生音频,以及最长 15 秒的时长
- How it fits in AI workflow
- 在单次生成中实现完整叙事序列制作,以 AI 导演的多镜头输出取代多片段组接工作流
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
可灵 3. 0 vs Runway Gen-4:可灵 3.
实用提示
在使用可灵 3.0 的多镜头分镜功能时,按经典电影语法来构思:用一个大全景建立场景,转到中景以呈现脉络和关系,再推进到特写以制造情感冲击。为每个镜头明确指定景别(大全景、中景、特写)以及相机运动和时长,会产出比模糊提示更具电影感的序列。
类型与变体
- 可灵 3.
- 0 推出两个主要模型变体。Video 3.
- 0 是标准旗舰,专注于电影叙事、精确的提示遵循、多语言音频和多镜头分镜。Video 3.
- 0 Omni(也称可灵 O3)加入了进阶的基于参考的生成,可让上传的参考视频提取并复现角色的视觉特征与声音特征,并扩展到具备 60fps 能力的 4K 输出。该系列还包括 Image 3.
- 0 和 Image 3.
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
可灵 3.
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
可灵 3.0 由快手科技于 2026 年 2 月 4 日正式推出。
多镜头分镜允许创作者在单次生成中指定最多六个不同的相机镜头,每个镜头都有各自的景别、相机运动、视角和叙事内容。模型会自动在所有镜头之间保持角色与场景的连续性,产出一段无需手动片段组接的剪辑式多镜头序列。
可灵 3.0 支持最长 15 秒的片段时长,在 O3 配置下支持最高原生 4K 分辨率、60 帧每秒。Video 3.0 标准版支持 1080p 输出。
可灵 3.0 的原生音频生成支持多种语言,包括英语、中文、日语、韩语和西班牙语,并带有美式、英式和印度英语等地区口音变体。
MVL 代表多模态视觉语言(Multi-modal Visual Language)。它是快手开发的架构框架,将文本描述、视觉参考、运动模式和编辑指令视为统一的输入语言,使模型能在单一集成系统中跨所有模态进行处理与生成。
可灵 3.0 最初向可灵 AI 平台的 Ultra 档位订阅用户提供独家抢先体验,随后才向更广泛的用户群开放。
可灵 3.0(Video 3.0)是专注于电影叙事和多镜头生成的标准旗舰。可灵 O3(Video 3.0 Omni)加入了完善的基于参考的生成,包括从参考视频中提取并复现角色视觉特征与声音的能力,并支持 60fps 的 4K 输出。