视频生成
Grok Imagine v1.5
由 xAI 提供
xAI带原生同步音频的图像生成视频模型。
让任意静态图像动起来,配上声音、对话和音乐。
图像生成视频文本生成视频原生同步音频唇形同步对话音效与音乐视频续接参考图引导生成电影级运镜控制

核心功能
Grok Imagine v1.5 与其他 AI 模型的不同之处
技术规格
关键规格和功能一览
xAI
出自打造Grok的团队
Grok Imagine
xAI Grok Imagine系列的1.5视频版本
May 30, 2026
以预览版形式发布
Image and text to video
让静态图动起来,或从文本Prompt生成
Native, synchronized
音乐、音效和唇形同步对话一次生成
480p or 720p
每次生成可选择输出分辨率
Up to 15s
片段长度可配置,最长15秒
24 fps
电影标准帧率
应用场景
创作者和企业如何在 Morphic 上使用 Grok Imagine v1.5
说话角色短片
一张肖像加一句对话,即可得到带配音的唇形同步片段,适合社交和讲解类内容。
产品动态广告
把一张产品照片做成带清晰运镜和内置声音设计的短片广告,事后无需音频剪辑。
音乐驱动片段
一次生成同时配上匹配的配乐和音效,让画面剪辑与声音同步抵达。
故事序列
从片段的最后一帧续接,由一张起始图像延展出更长的段落,再不断串联镜头。
风格与角色参考
传入参考图,在同一简报下的多次生成中保持某种观感或某个角色稳定一致。
分镜转动态
把单张关键帧变成动态画面,在投入完整制作前预览一个镜头。
提示词示例
打开任意提示词进行编辑并生成
简单定价
今天就免费开始,随时可以升级或取消。
Basic
900 每月 信用
1 个用户
所有模型
工作流
Standard
3200 每月 信用
1 个用户
所有模型
工作流
Pro
6200 共享 每月 信用
1 用户
+ 最多 4 人额外付费可增加
所有模型
工作流
Pro Max
24000 共享 每月 信用
1 用户
+ 最多 9 人额外付费可增加
所有模型
工作流
Enterprise
更高的限制
自定义
定价和账单条款
无限信用
自定义席位限制
所有模型
工作流

Free
For playing around
$0
forever free
最多 20 积分
仅1个用户
部分模型
工作流
常见问题
什么是Grok Imagine Video 1.5?
Grok Imagine Video 1.5是xAI的图像生成视频模型,于2026年5月30日以预览版形式发布。它把一张静态图像(或一句文本Prompt)动画化为带原生同步音频的片段,包括音乐、音效和唇形同步对话,并支持视频续接和参考图引导生成。
Grok Imagine Video 1.5会生成音频吗?
会。音频与视频原生一同生成,并与画面动作保持同步。一次生成就能包含背景音乐、音效和唇形同步对话,因此在片段渲染完成后无需再单独做一遍音频处理。
在Morphic上如何使用Grok Imagine Video 1.5?
打开Morphic,将提示栏切换到视频模式,并在模型选择器中选择Grok Imagine Video 1.5。附加一张起始图像,描述你想要的动作以及任何对话或声音,然后运行Prompt。需要调整时,在下一条消息中说明即可。
Grok Imagine Video 1.5支持哪些输入?
用于图像生成视频时,它支持一张图像加一句文本Prompt;用于文本生成视频时,也可单独使用一句文本Prompt。你还可以传入参考图来引导风格、角色和构图,并通过视频续接从片段的最后一帧继续生成。
Grok Imagine Video 1.5的片段有多长?
片段长度可配置,最长15秒。若需更长的序列,可使用视频续接从片段的最后一帧继续,并从同一张起始图像把多个镜头串联起来。
Grok Imagine Video 1.5输出什么分辨率?
你可以在480p或720p、24帧每秒下生成,并可配置画面比例,用于横向、方形或竖向交付。每次生成都能按你要发布的平台选择分辨率。
从Grok Imagine 1.0到1.5有哪些变化?
1.5版本聚焦于音频、一致性和整体质量,对复杂多要素场景的Prompt遵循更强,生成更快也更稳定。相比上一代模型,原生同步音频和视频续接是最主要的新增能力。
Grok Imagine Video 1.5与Seedance 2.0相比如何?
两者都是带原生音频的视频模型。Seedance 2.0每次生成最多支持12个混合素材,具备音乐节拍同步,分辨率1080p,时长4到15秒。Grok Imagine Video 1.5以图像生成视频为核心,支持唇形同步对话和音效、视频续接以及参考图引导控制,分辨率480p或720p,最长15秒。
这与Morphic上的Grok Imagine模型有何不同?
原版Grok Imagine是xAI的跨模态模型,涵盖文本生成图像、图像编辑以及多条视频路径。Grok Imagine Video 1.5是专门的视频版本,针对图像生成视频做了调优,具备原生同步音频、唇形同步对话和视频续接。