可灵 2.6

可灵 2.6是什么?

可灵 2.6 是首个在一次生成中同时创建视频与匹配声音(配音、音效、环境音)的可灵版本,事后无需单独的音频编辑。

一图看懂

Type of model
具备原生音视频生成的文生视频与图生视频生成式 AI 模型
Developed by
快手科技(Kuaishou Technology)
Key capability
在单次生成中同步生成音频与视频,并具备运动控制、Elements 角色一致性以及首末帧条件化
How it fits in AI workflow
免去 AI 视频管线中单独的音频后期制作,通过角色一致性和帧串接精简多场景内容制作
相关术语
Kling 2.5Kling 3.0Kling O3KlingElementsAudio-visual generation

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

可灵 2. 6 vs Sora 2:可灵 2. 6 提供更可靠的原生音频生成,以及包括 Elements 参考系统在内的更优角色一致性工具;Sora 2 在照片级写实场景中产出更高的电影级保真度,但需要单独的音频制作,增加了可灵 2.


实用提示

要在可灵 2.6 中构建超过 10 秒的场景,使用首末帧串接技法:导出一段生成片段的末帧,并将其上传作为下一段生成的首帧。结合用于角色一致性的 Elements 参考系统,这能让你构建出视觉与音频连续无缝的延展多场景序列。

类型与变体

  • 可灵 2.
  • 6 提供 Standard 和 Pro 两个档位。Pro 档位解锁更高分辨率输出(最高 1080p)、更高帧率,以及对全套音视频和运动控制功能的访问。该模型同时支持文本到音视频和图像到音视频两种生成模式。可灵 2.
  • 6 由可灵 3.

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

可灵 2.

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

可灵 2.6 何时发布?

可灵 2.6 由快手科技于 2025 年 12 月 3 日发布。它在前代基础上提升了生成质量、增强了运动保真度并使输出更稳定,并在 Morphic 平台上与其他领先的 AI 视频模型一同提供。

可灵 2.6 中原生音频的意义是什么?

可灵 2.6 是可灵家族中首个在单次生成中产出同步音频与视频的模型。这免去了先生成无声 AI 视频、再单独录制或编辑音频的传统工作流,显著减少了制作时间和复杂度。

可灵 2.6 能生成哪些类型的音频?

可灵 2.6 能生成独立或组合的音频类型,包括语音、对白、旁白、歌唱、说唱、环境音效和混合音效。它支持多角色对白,并以出色的中文语音生成表现著称。

可灵 2.6 中的 Elements 功能是什么?

Elements 允许创作者上传最多四张参考图像,以定义模型将在生成镜头之间一致保持的角色、环境或道具。这使得无需在每条提示中重新描述角色,即可实现具有持久、可辨识角色的多场景叙事。

可灵 2.6 支持什么分辨率和帧率?

可灵 2.6 Pro 支持最高 1080p 分辨率、最高 48 帧每秒,片段最长时长为 10 秒。

可灵 2.6 中的运动控制如何工作?

可灵 2.6 支持来自参考视频的运动迁移,意味着创作者可以上传一段展示所需动作的视频,模型会在新生成的内容中复现这些运动特征。它还支持运动笔刷工具以及基于提示的标准相机导演。

可灵 2.6 的后继版本是什么?

于 2026 年 2 月 4 日推出的可灵 3.0 系列承接了可灵 2.6。可灵 3.0 在 2.6 的音视频基础上构建,并引入了统一多模态输入、多镜头分镜、4K 输出以及最长 15 秒的片段时长。

Can't find what you are looking for?
Contact us and let us know.
bg