Deforum
Deforum是什么?
Deforum 是一款开源工具,通过让用户定义图像、摄影机和提示词如何在一连串帧上随时间演变,将 Stable Diffusion 的图像生成转变为动画。
一图看懂
- Type of model
- 用于 Stable Diffusion 的开源动画扩展,而非独立模型
- Developed by
- 开源社区(Deforum 贡献者)
- Key capability
- 基于关键帧对 Stable Diffusion 输出进行动画处理,具备摄影机运动控制、提示词调度和逐帧变换参数
- How it fits in AI workflow
- 用于在 Stable Diffusion 生态系统内制作 AI 动画视频序列,尤其适合需要比专用视频模型更强控制力的实验性、风格化和参数驱动型动画
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
Deforum 与专用视频生成模型的对比:Runway 或 Kling 等专用视频生成模型将视频作为一个统一序列生成,具有学习得到的时间一致性,产生看起来自然且物理合理的运动。Deforum 则逐帧生成,并在每帧之间应用变换,产生一种标志性的流动变幻美感,在视觉上独具特色,但时间一致性不如专用视频模型。Deforum 提供更强的参数级控制;专用模型提供更自然的运动和更简单的操作。
实用提示
使用 Deforum 制作动画时,设置较小的每帧变换数值并使用更长的序列,比每帧大幅跳跃能产生更平滑、更可控的运动。在 300 帧上每帧 0.02 的变焦增量会创造出稳定、渐进、具有电影感的变焦;而在 30 帧上每帧 0.2 的变焦虽然产生相同的总位移,看起来却快速而生硬。对于精致的输出而言,搭配更长序列的细微设置几乎总是更可取。
类型与变体
2D 模式将变换直接作用于生成的帧,把它当作一张平面图像,包括变焦、旋转和平移,通过逐帧的图像操作来产生动画。3D 模式使用深度估计来应用透视正确的摄影机运动模拟,营造出更令人信服的穿越三维空间的感觉。视频输入模式将一段已有视频作为每一生成帧的初始化,在真实素材之上叠加 Deforum 的风格化处理。提示词调度允许文本提示词在指定的关键帧位置发生变化,使动画内容能在序列的时长内在不同主体或风格之间演变。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
为艺术项目、音乐视频和创意探索制作实验性和迷幻风格的 AI 动画序列。生成梦境般、随时间在主体与环境之间持续变幻流动的画面。为现场演出、装置艺术和动态图形语境创作循环播放的动画背景和视觉环境。通过 Deforum 的视频输入模式,逐帧应用 Stable Diffusion 美学来风格化已有的视频素材。构建具有精确控制的摄影机运动与提示词演变的长篇 AI 动画序列,而这是专用视频模型在同等参数级别上无法复制的。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
Deforum 是 Stable Diffusion 的一个开源扩展,可在 AI 生成视频中实现基于关键帧的动画与摄影机运动控制。它逐帧生成画面并逐步调整参数,从 Stable Diffusion 图像生成流程中产出动画序列。
Deforum 将每一视频帧作为独立的 Stable Diffusion 图像生成,根据用户定义的关键帧时间表,在帧之间应用变焦、旋转、平移和提示词变化等增量变换。生成的各帧随后被编译成视频序列。
提示词调度允许引导生成的文本提示词在动画过程中指定的关键帧位置发生变化,使图像内容能在序列的时长内在不同主体或美学风格之间演变。
是的,在特定用例中有用。Deforum 对动画时间表提供专用视频模型所不具备的精细参数级控制,其标志性的流动变幻美感独具特色,在实验性和艺术语境中颇受重视。对于在 Stable Diffusion 生态系统中工作的创作者而言,它依然具有意义。
2D 模式将变换作为平面图像操作来应用,直接对生成的帧进行变焦、旋转或平移。3D 模式使用深度估计来应用透视正确的摄影机运动模拟,营造出更令人信服的穿越三维空间的感觉。
Deforum 产生一种独特的流动变幻动画风格,图像内容随着摄影机仿佛穿越或环绕生成的视觉形态而持续演变和转换。这种美感在扩散模型早期成为一种可辨识的 AI 视频艺术流派。
Deforum 可以通过 Automatic1111 或其他带图形用户界面的 Stable Diffusion 界面访问,降低了直接与代码交互的需求。不过,提示词调度和自定义参数的进阶使用,会受益于对底层参数结构的熟悉。
可以。Deforum 的视频输入模式将已有视频作为帧初始化,逐帧在源素材之上叠加 Stable Diffusion 风格化处理。这会产生一个以所选模型和提示词美学呈现的、原始视频内容的风格化版本。