可灵 2.6
可灵 2.6是什么?
可灵 2.6 是首个在一次生成中同时创建视频与匹配声音(配音、音效、环境音)的可灵版本,事后无需单独的音频编辑。
一图看懂
- Type of model
- 具备原生音视频生成的文生视频与图生视频生成式 AI 模型
- Developed by
- 快手科技(Kuaishou Technology)
- Key capability
- 在单次生成中同步生成音频与视频,并具备运动控制、Elements 角色一致性以及首末帧条件化
- How it fits in AI workflow
- 免去 AI 视频管线中单独的音频后期制作,通过角色一致性和帧串接精简多场景内容制作
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
可灵 2. 6 vs Sora 2:可灵 2. 6 提供更可靠的原生音频生成,以及包括 Elements 参考系统在内的更优角色一致性工具;Sora 2 在照片级写实场景中产出更高的电影级保真度,但需要单独的音频制作,增加了可灵 2.
实用提示
要在可灵 2.6 中构建超过 10 秒的场景,使用首末帧串接技法:导出一段生成片段的末帧,并将其上传作为下一段生成的首帧。结合用于角色一致性的 Elements 参考系统,这能让你构建出视觉与音频连续无缝的延展多场景序列。
类型与变体
- 可灵 2.
- 6 提供 Standard 和 Pro 两个档位。Pro 档位解锁更高分辨率输出(最高 1080p)、更高帧率,以及对全套音视频和运动控制功能的访问。该模型同时支持文本到音视频和图像到音视频两种生成模式。可灵 2.
- 6 由可灵 3.
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
可灵 2.
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
可灵 2.6 由快手科技于 2025 年 12 月 3 日发布。它在前代基础上提升了生成质量、增强了运动保真度并使输出更稳定,并在 Morphic 平台上与其他领先的 AI 视频模型一同提供。
可灵 2.6 是可灵家族中首个在单次生成中产出同步音频与视频的模型。这免去了先生成无声 AI 视频、再单独录制或编辑音频的传统工作流,显著减少了制作时间和复杂度。
可灵 2.6 能生成独立或组合的音频类型,包括语音、对白、旁白、歌唱、说唱、环境音效和混合音效。它支持多角色对白,并以出色的中文语音生成表现著称。
Elements 允许创作者上传最多四张参考图像,以定义模型将在生成镜头之间一致保持的角色、环境或道具。这使得无需在每条提示中重新描述角色,即可实现具有持久、可辨识角色的多场景叙事。
可灵 2.6 Pro 支持最高 1080p 分辨率、最高 48 帧每秒,片段最长时长为 10 秒。
可灵 2.6 支持来自参考视频的运动迁移,意味着创作者可以上传一段展示所需动作的视频,模型会在新生成的内容中复现这些运动特征。它还支持运动笔刷工具以及基于提示的标准相机导演。
于 2026 年 2 月 4 日推出的可灵 3.0 系列承接了可灵 2.6。可灵 3.0 在 2.6 的音视频基础上构建,并引入了统一多模态输入、多镜头分镜、4K 输出以及最长 15 秒的片段时长。