Question 1

哪类输入视频最适合视频生视频生成?

Accepted Answer

主体清晰、光照良好、背景相对干净,且运动平滑、清晰可读、模型能够准确跟随的片段,往往能产出最流畅的视频生视频输出。运动极快、镜头剧烈抖动、动作复杂重叠或视觉噪点明显的素材,模型更难准确条件化。对于专门用作运动参考的代用素材,把运动的清晰度置于视觉质量之上:AI 读取的是运动,而不是审美。

Question 2

条件强度在视频生视频生成中控制什么?

Accepted Answer

条件强度支配生成输出对输入视频的结构与运动的遵循程度。在高条件强度下,输出会紧密跟随源素材的构图、主体位置与运动轨迹。在较低条件强度下,模型有更多自由对源素材进行创作性的再诠释,可能为追求视觉上更流畅或风格上更一致的结果而产出偏离原始结构的输出。为某个特定源素材与风格目标找到合适的条件强度,往往需要反复试验。

Question 3

视频生视频能以 AI 生成素材作为源吗?

Accepted Answer

可以,这正是用于精修与风格再处理的常见工作流。一个运动与构图都很好、但视觉质感不尽人意的 AI 生成,可以用作视频生视频的输入,由第二轮生成施加精炼的视觉引导,同时保留第一轮生成的时间结构。这种迭代方式让创作者可以把“达成正确运动”的问题与“达成正确视觉风格”的问题分开来处理。

Question 4

视频生视频与视频上采样有何不同?

Accepted Answer

视频上采样提升既有视频的空间分辨率(让画面更锐利、更大、更细致),而不改变其视觉风格、运动或内容。视频生视频则根据风格引导变换素材的视觉外观,可能改变画面的审美、色彩处理、纹理与渲染质感,同时保留运动。上采样是一种质量增强;视频生视频是一种创作性的变换。

Question 5

视频生视频会保留源素材的音频吗?

Accepted Answer

视频生视频生成通常只在视觉通道上运作,产出变换后的视频输出,而不生成或保留音频。源音频必须单独处理:要么在后期制作中从原始素材中沿用,要么用新的音频元素替换。一些平台可能在其工作流中提供音频保留功能,但生成操作本身聚焦于视觉变换。

Question 6

我能用视频生视频来让静态图像动起来吗?

Accepted Answer

从视频输入让一张静态图像动起来,需要一种不同的技法:通常是图生视频生成,它以单一帧作为视觉锚点并从中生成运动。视频生视频需要一个真正带有跨多帧时间信息的视频输入。要让静态图像动起来,请使用图生视频生成,而不是视频生视频。

Question 7

视频生视频能给素材施加哪些视觉风格?

Accepted Answer

可施加的风格范围很广,取决于具体生成模型的能力。常见应用包括把实拍素材变换为动画审美、施加绘画或插画式处理、把素材渲染为不同的电影化风格(高对比黑色电影、低饱和纪录片、魔幻时刻的暖调)、施加某种特定类型的视觉处理,或围绕真实世界的运动生成一个奇幻或科幻环境。可用的风格受限于模型所受过的训练,以及文字与图像提示能有效指定的范围。

Question 8

视频生视频生成的源视频可以多长?

Accepted Answer

当前的 AI 视频生成模型通常在一次生成操作中处理大约五到二十秒的片段,不过这在很大程度上因平台与模型而异。对于更长的源素材,常见做法是把素材分成连续片段来处理:把源切分为若干段,分别生成每一段,再在后期剪辑中拼接结果。被分开处理的各段之间的时间一致性,需要在所有段落上对提示词与条件设置保持一致,并加以仔细留意。

视频生视频(Video-to-Video)

视频生视频(Video-to-Video)是什么？

执导场景、设计角色、完成整部影片

类型与变体

准备好在 Morphic 里做第一个场景了吗？

常见使用场景

执导场景、设计角色、完成整部影片

常见问题（FAQ）