视频生成
Happy Horse 1.1
由 Alibaba 提供
阿里巴巴的视频模型。
同步音频与原生口型同步,一次生成即可完成。

核心功能
技术规格
1080p
交付用 1080p,想更快出草稿可用 720p。
3–15s
每个片段时长 3 到 15 秒,默认 5 秒。
7
七种语言的原生口型同步,贴合每种语言的发音。
最多 9
可带入最多九个主体,在提示词中按索引逐一调用。
应用场景
以对白为核心的场景
角色用 7 种语言中的任意一种说话,口型、环境音和节奏同步,在一次生成中一并完成。
多角色叙事
从参考图中保留最多九个主体并贯穿各场景,按索引调用每个主体,实现稳定的群像表现。
广告与活动片
基于参考的控制让产品、出镜者和品牌视觉在镜头间保持一致,音频与动作同步。
音乐视频与表演
视频与音频一并生成,动作从首次生成起就踩在节拍上,事后无需手动对齐。
超宽与竖屏
同一场景以 21:9 电影感剪辑和 9:16 竖屏从九种画幅中输出,无需为每种格式单独走流程。
多语种本地化
同一场景、同一角色,仅将台词在语言间替换,配以原生口型同步,适合全球投放。
提示词示例
简单定价
今天就免费开始,随时可以升级或取消。
Basic
900 每月 信用
1 个用户
所有模型
工作流
Standard
3200 每月 信用
1 个用户
所有模型
工作流
Pro
6200 共享 每月 信用
1 用户
+ 最多 4 人额外付费可增加
所有模型
工作流
Pro Max
24000 共享 每月 信用
1 用户
+ 最多 9 人额外付费可增加
所有模型
工作流
Enterprise
更高的限制
自定义
定价和账单条款
无限信用
自定义席位限制
所有模型
工作流

Free
For playing around
$0
forever free
最多 20 积分
仅1个用户
部分模型
工作流
常见问题
Happy Horse 1.1 是什么?
Happy Horse 1.1 是阿里巴巴的视频生成模型,部署在 fal 上,并在 Morphic 提供。它在一次生成中同时产出视频和同步音频,支持七种语言的原生口型同步。它支持 text-to-video、image-to-video 和 reference-to-video,可输出 3 到 15 秒的 1080p 片段,覆盖九种画幅比例。
Happy Horse 1.1 最适合做什么?
Happy Horse 1.1 擅长对白和表演场景,因为它在一次生成中同时产出同步音频和原生口型同步。最多九个主体的 reference-to-video 适合多角色与群像创作,九种画幅覆盖电影感 21:9、竖屏 9:16 和方形交付。
Happy Horse 1.1 会生成音频和口型同步吗?
会。Happy Horse 1.1 在一次生成中同时产出视频和音频,因此台词、音效、环境声和音乐都与动作保持同步,无需单独的音频步骤。它在七种语言中提供原生口型同步:英语、普通话、粤语、日语、韩语、德语和法语,口型贴合每种所说语言。
Happy Horse 1.1 的 reference-to-video 如何运作?
提供最多九张参考图,并按你给出的顺序在提示词中以 character1 到 character9 逐一调用。Happy Horse 1.1 会把每个主体带入新场景,让一组角色在镜头之间保持可辨。先指明哪个主体来自哪张图,再描述场景和动作。
Happy Horse 1.1 支持哪些分辨率、时长和画幅比例?
Happy Horse 1.1 输出 720p 或 1080p,片段时长 3 到 15 秒,默认 5 秒。它支持九种画幅比例:16:9、9:16、1:1、4:3、3:4、21:9、9:21、5:4 和 4:5。提示词最长可达 2,500 个字符。
如何在 Morphic 上使用 Happy Horse 1.1?
打开 Morphic,将提示栏切换到 Video 模式,并在模型选择器中选择 Happy Horse 1.1。描述你的场景,按需附上用于 image-to-video 的静帧,或用于 reference-to-video 的最多九张参考图,然后选择分辨率和画幅比例并运行提示词。音频会在同一次生成中产出。