视频生成

Grok Imagine Video 1.5

由 xAI 提供

xAI带原生同步音频的图像生成视频模型。让任意静态图像动起来,配上声音、对话和音乐。

图像生成视频文本生成视频原生同步音频唇形同步对话音效与音乐视频续接参考图引导生成电影级运镜控制

Grok Imagine Video 1.5

由 xAI 提供

核心功能

Grok Imagine Video 1.5 与其他 AI 模型的不同之处

技术规格

关键规格和功能一览

xAI

出自打造Grok的团队

Grok Imagine

xAI Grok Imagine系列的1.5视频版本

May 30, 2026

以预览版形式发布

Image and text to video

让静态图动起来,或从文本Prompt生成

Native, synchronized

音乐、音效和唇形同步对话一次生成

480p or 720p

每次生成可选择输出分辨率

Up to 15s

片段长度可配置,最长15秒

24 fps

电影标准帧率

应用场景

创作者和企业如何在 Morphic 上使用 Grok Imagine Video 1.5

说话角色短片

一张肖像加一句对话,即可得到带配音的唇形同步片段,适合社交和讲解类内容。

产品动态广告

把一张产品照片做成带清晰运镜和内置声音设计的短片广告,事后无需音频剪辑。

音乐驱动片段

一次生成同时配上匹配的配乐和音效,让画面剪辑与声音同步抵达。

故事序列

从片段的最后一帧续接,由一张起始图像延展出更长的段落,再不断串联镜头。

风格与角色参考

传入参考图,在同一简报下的多次生成中保持某种观感或某个角色稳定一致。

分镜转动态

把单张关键帧变成动态画面,在投入完整制作前预览一个镜头。

提示词示例

打开任意提示词进行编辑并生成

让肖像动起来

上传一张肖像:人物微笑、看向镜头、说一句欢迎语,柔和的影棚光,自然的唇形同步

Edit prompt

产品短片

上传一张产品照片:缓缓推近瓶身,水珠凝结,柔和的轮廓光,轻微的环境声

Edit prompt

风景活起来

上传一张风景图:风吹过草地,云朵飘动,飞鸟掠过画面,柔和的自然环境声

Edit prompt

角色运动

上传一张角色渲染图:人物转身朝镜头走来,扬起尘土,低沉的脚步声

Edit prompt

音乐驱动的节拍

上传一张霓虹街景静帧:镜头向前推轨,招牌闪烁,下方铺一段欢快的合成器音轨

Edit prompt

故事续接

从最后一帧继续:门被推开,暖光涌入,铰链吱呀作响,平静的房间环境声

Edit prompt

简单定价

今天就免费开始,随时可以升级或取消。

Basic

$0/
账单金额为 $0 每年

500 每月 信用

1 个用户

所有模型

工作流

Standard

$0/
账单金额为 $0 每年

2800 每月 信用

1 个用户

所有模型

工作流

Pro

$0/
账单金额为 $0 每年

6000 共享 每月 信用

1 用户

+ 最多 4 人额外付费可增加

所有模型

工作流

Pro Max

$0/
账单金额为 $0 每年

24000 共享 每月 信用

1 用户

+ 最多 9 人额外付费可增加

所有模型

工作流

Enterprise

更高的限制

自定义

定价和账单条款

无限信用
自定义席位限制
所有模型
工作流
Pricing Gradient

Free

For playing around

$0

forever free

最多 20 积分
仅1个用户
部分模型
工作流

FAQs

什么是Grok Imagine Video 1.5?
Grok Imagine Video 1.5是xAI的图像生成视频模型,于2026年5月30日以预览版形式发布。它把一张静态图像(或一句文本Prompt)动画化为带原生同步音频的片段,包括音乐、音效和唇形同步对话,并支持视频续接和参考图引导生成。
Grok Imagine Video 1.5会生成音频吗?
会。音频与视频原生一同生成,并与画面动作保持同步。一次生成就能包含背景音乐、音效和唇形同步对话,因此在片段渲染完成后无需再单独做一遍音频处理。
在Morphic上如何使用Grok Imagine Video 1.5?
打开Morphic,将提示栏切换到视频模式,并在模型选择器中选择Grok Imagine Video 1.5。附加一张起始图像,描述你想要的动作以及任何对话或声音,然后运行Prompt。需要调整时,在下一条消息中说明即可。
Grok Imagine Video 1.5支持哪些输入?
用于图像生成视频时,它支持一张图像加一句文本Prompt;用于文本生成视频时,也可单独使用一句文本Prompt。你还可以传入参考图来引导风格、角色和构图,并通过视频续接从片段的最后一帧继续生成。
Grok Imagine Video 1.5的片段有多长?
片段长度可配置,最长15秒。若需更长的序列,可使用视频续接从片段的最后一帧继续,并从同一张起始图像把多个镜头串联起来。
Grok Imagine Video 1.5输出什么分辨率?
你可以在480p或720p、24帧每秒下生成,并可配置画面比例,用于横向、方形或竖向交付。每次生成都能按你要发布的平台选择分辨率。
从Grok Imagine 1.0到1.5有哪些变化?
1.5版本聚焦于音频、一致性和整体质量,对复杂多要素场景的Prompt遵循更强,生成更快也更稳定。相比上一代模型,原生同步音频和视频续接是最主要的新增能力。
Grok Imagine Video 1.5与Seedance 2.0相比如何?
两者都是带原生音频的视频模型。Seedance 2.0每次生成最多支持12个混合素材,具备音乐节拍同步,分辨率1080p,时长4到15秒。Grok Imagine Video 1.5以图像生成视频为核心,支持唇形同步对话和音效、视频续接以及参考图引导控制,分辨率480p或720p,最长15秒。
这与Morphic上的Grok Imagine模型有何不同?
原版Grok Imagine是xAI的跨模态模型,涵盖文本生成图像、图像编辑以及多条视频路径。Grok Imagine Video 1.5是专门的视频版本,针对图像生成视频做了调优,具备原生同步音频、唇形同步对话和视频续接。

在 Morphic 上 Grok Imagine Video 1.5 试用

注册 Morphic,开始使用 Grok Imagine Video 1.5 进行创作。无需下载,无需设置,只需描述您的想法即可生成。