AI 模型
on Morphic

探索 Morphic 上所有可用的 AI 模型,从图像和视频生成到音频制作和画质增强。

icons
音频

Seed Audio 1.0

ByteDance

Seed Audio 1.0 是字节跳动的一体化音频模型:在一次生成中同时产出语音、音效和背景音乐,超越传统的文本转语音。

视频

Seedance 2.0 4K

ByteDance

字节跳动的 Seedance 2.0 现在可在 Morphic 上以原生 4K 生成。锐利的细节与干净的纹理在运动中保持稳定,并支持多模态输入、原生音频和可控的镜头运动。

视频

Seedance 2.5

ByteDance

Seedance 2.5 是字节跳动的新一代视频模型:单镜头原生视频最长 30 秒,最多 50 个多模态参考,更强的片段内编辑,以及 720p 到 4K 输出。

图像

Seedream 5.0 Pro

ByteDance

Seedream 5.0 Pro 是字节跳动的新一代图像模型:精准的分层编辑、深度思考生成、内置联网搜索,输出干净到足以用作 Seedance 视频的参考。

视频

Happy Horse 1.1

Alibaba

Morphic 上的阿里巴巴音视频联合模型。Happy Horse 1.1 在一次生成中同时产出视频和同步音频,支持原生多语种口型同步、最多 9 个主体的 reference-to-video,以及九种画幅比例。

视频

Kling 3.0 Turbo

Kling

快手在 Morphic 上推出的速度优化版 Kling 视频模型。Kling 3.0 Turbo 保持出色的提示词还原度和多镜头一致性,同时在 720p 和 1080p 下快速生成。

视频

Seedance 2.0 Mini

ByteDance

ByteDance 的轻量 Seedance 2.0 档位。支持图像、视频和音频多模态参考,最高 1080p,价格约为 Seedance 2.0 的一半。

图像

Ideogram 4.0

Ideogram

Ideogram 的开源权重图像模型。顶尖的图内文字渲染、边界框版面控制、结构化 JSON 提示词,以及附商用许可的 2K 输出。

图像

Reve 2.0

Reve AI

Reve AI 的布局优先图像模型,也称 Reve Image 2。手动放置每个元素,像编辑设计文件一样修改结果,并以最高 4K 渲染清晰文字。

文本到图像基于布局的控制图像编辑多参考构图+2 更多
视频

Bernini

ByteDance

字节跳动的开源统一模型,用于 AI 视频编辑与生成。可在片段中添加、移除或重新风格化元素,未改动的区域保持不变,并支持保持身份一致的主体到视频。

视频编辑主体到视频参考引导编辑文本到视频+1 更多
视频

Grok Imagine v1.5

xAI

xAI在Morphic上的图像生成视频模型。将一张静态图像转化为带原生同步音频的片段,支持唇形同步对话、音效和音乐,并具备出色的Prompt遵循能力和视频续接。

图像生成视频文本生成视频原生同步音频唇形同步对话+4 更多
视频

Veo 4

Google DeepMind

Google DeepMind的下一代视频模型。Veo 4突破Veo 3.1的8秒上限,带来更长的原生4K片段、锁定的多镜头角色、分镜序列、电影级镜头语言和多说话人原生音频。

文本生视频图像生视频帧生视频参考生视频+5 更多
图像

MAI-Image-2.5

Microsoft

在 Morphic 上使用微软的文生图模型。MAI-Image-2.5 以第 3 名登上 Arena 文生图榜单,带来更清晰的文字渲染、风格化插画与商业级视觉,适配设计与品牌工作。

文生图图内文字渲染风格化插画商业视觉+4 更多
多模态

Gemini Omni

Google DeepMind

Google的any-to-any多模态模型,现已规划上线Morphic。Gemini Omni Flash将文本、图像、音频和视频融合为一段视频,支持角色一致性、精确物理、对话式编辑和SynthID水印。

图像

Recraft V4.1 Pro

Recraft

Recraft 旗舰光栅层级,围绕更安静的写实、更柔和的渐变,以及像创意总监一样读懂短提示的模型重建。2K 原生输出,设计级构图。

文本生成图像图像生成图像
图像

Krea 2

Krea AI

Krea AI 首个从零打造的基础图像模型现已登陆 Morphic,专为美感与创作把控而生。支持参考图风格迁移、情绪板、创意调节,从颗粒胶片到干净的影棚写实,覆盖广泛风格。

视频

Happy Horse 1.0

Alibaba

阿里巴巴的视频模型,一次生成同时输出视频与音频。支持7种语言的原生唇形同步、1080p输出、参考驱动控制,发布时在Artificial Analysis Video Arena的Elo榜上排名第一。

文本生成视频图像生成视频参考生成视频视频编辑+3 更多
图像

ChatGPT Images 2.0

OpenAI

OpenAI 的图像模型,具备原生推理、最高 2K 输出、保持角色一致的多图批量生成,以及面向图表、海报和设计工作的强大多语言文字渲染。

文本生成图像图像生成图像思考模式多图批量+2 更多
音频

Gemini 3.1 Flash TTS

Google DeepMind

Google 在 Morphic 上最具表现力的文本转语音模型。Gemini 3.1 Flash TTS 将文本转化为自然、可调度的旁白,提供内嵌音频标签、多人对话和 SynthID 水印,并支持多种语言。

视频

Sync V3

Sync

Sync 的旗舰口型同步模型。Sync V3(sync-3)具备镜头级理解、遮挡处理和极端角度支持,生成无闪烁的 4K 口型同步。

口型同步音频驱动的视频生成
视频

Wan 2.7

Alibaba

阿里巴巴旗舰 Wan 视频模型,具备 Thinking Mode 提示推理、电影级 1080p 输出,以及跨镜头的参考驱动角色一致性。

文本生成视频图像生成视频参考生成视频视频编辑
视频

LTX 2.3

Lightricks

Lightricks 的开源音视频视频模型。LTX 2.3 在单次生成中同步产出视频和音频,原生竖屏输出最高可达 4K。

文本转视频图像转视频音频转视频原生音频生成
图像

Nano Banana 2

Google DeepMind

Google DeepMind 的 Gemini 3.1 Flash Image。以 Flash 速度实现专业级图像生成:在最多 5 个角色和 14 个对象间保持主体一致性、实时网络接地、精准文字渲染,以及最高 4K 的分辨率。

文字生成图像图像生成图像多轮编辑主体一致性+3 更多
视频

Kling 3.0

Kling

快手的提示词优先旗舰视频模型。Kling 3.0(V3)以原生 1080p 与 4K、30fps 提供照片级真实的运动、多镜头导演模式以及原生多语言音频。

文本生成视频图像生成视频多镜头导演模式原生音频
图像

Recraft V4 Pro

Recraft

Recraft 的高分辨率栅格图像模型,围绕设计品味、精细的人体表现、平衡的构图以及 2K 原生输出的版面级细节重新构建。

文本生成图像图像生成图像
图像

Seedream 5.0 Lite

ByteDance

字节跳动以推理为先的图像模型。Seedream 5.0 Lite 将深度思考生成与内置在线搜索结合,让与时事相关的提示词能够带着实时上下文呈现。

文本生成图像基于推理的生成在线搜索上下文
图像

Qwen Edit Angles

Alibaba Qwen

阿里巴巴的 Qwen-Image-Edit 多角度模型。从单张输入图像生成同一主体的不同相机视角,并保持几何结构、光照和身份一致。

图像到图像新视角合成相机感知编辑
视频

Seedance 1.5 Pro

ByteDance

字节跳动的原生音画视频模型。Seedance 1.5 Pro 一次生成即可输出同步的视频与音频,支持多语言唇形同步和电影级镜头控制。

文本生成视频图像生成视频原生音频生成多语言唇形同步
图像

Seedream 4.5

ByteDance

ByteDance 升级版图像模型,提升了提示词遵循度、多图参考处理与密集文字渲染,将文本生成图像与图像编辑统一到一个模型中。

文本生成图像图像生成图像多图参考
视频

Seedance 2.0

ByteDance

字节跳动新一代多模态AI视频模型, 支持图片、视频、音频、文本同时输入。提供超逼真运动、可控摄像机运动、原生音频合成、音乐节拍同步和无缝视频延展,每次生成最多支持12个素材。

文本生成视频图片生成视频视频生成视频音频生成视频+7 更多
图像

Flux 2 Pro

Black Forest Labs

Black Forest Labs的旗舰AI图像生成模型。最高2K分辨率、精细的细节还原和出色的提示词理解力,是专业级图像生成的首选。

文本生图
图像

Gemini Image Pro

Google

Google的旗舰AI图像生成模型。Gemini Image的所有功能加上更高分辨率、更精细细节和更高逼真度。

文本生图图像编辑文字渲染多模态理解
图像

Nano Banana Pro

Google DeepMind

Google DeepMind 的 Gemini 3 Pro Image。具备主体一致性、专业文字渲染、基于网络的准确性,以及 14 种宽高比下最高 4K 分辨率的工作室级图像生成与编辑。

文本生成图像图像生成图像多轮编辑主体一致性+3 更多
视频

Hailuo AI 2.3

MiniMax

MiniMax最新旗舰AI视频模型。更长时长、更高运动品质、更出色的视觉保真度,全面升级的视频生成体验。

文本生视频图像生视频
视频

Wan 2.6

Alibaba

阿里巴巴的开源AI视频生成模型。优秀的性价比和稳定的品质,是日常视频生成的最佳选择。

文本生视频图像生视频
视频

Veed Fabric 1.0

Veed

Veed 的说话视频模型。Fabric 1.0 接收一张静态图像加一个音频文件,生成口型、头部、身体和手部动作同步的说话视频。

图像生成说话视频音频驱动动画口型同步
视频

Vidu Q3

Shengshu Technology

生数科技最新AI视频模型。更高运动品质、更长时长、更出色的视觉保真度,全面升级的视频生成体验。

文本生视频图像生视频参考生视频
视频

Veo 3.1

Google DeepMind

Google DeepMind的最新AI视频生成模型。行业领先的分辨率、精确的物理模拟和出色的时间一致性,代表了AI视频生成的技术前沿。

文本生视频图像生视频帧生视频参考图生视频+1 更多
视频

Sora

OpenAI

OpenAI的旗舰AI视频生成模型。将文本和图像转化为电影级视频,具有出色的物理模拟、叙事理解和画面品质。

文本生视频图像生视频
视频

Kling O3

Kling

快手最新旗舰AI视频模型。支持文本、图像、参考图三种输入方式生成视频,Kling系列最高品质和最丰富功能。

文本生视频图像生视频视频生视频首末帧生视频+2 更多
视频

Kling

Kling

快手的旗舰AI视频生成模型(v2.6 Pro)。具有出色的运动质量、高保真视觉效果和灵活的输入方式,是目前最受欢迎的AI视频模型之一。

文本生视频图像生视频
工具

Topaz Image Upscaler

Topaz Labs

Topaz Labs的AI图像放大工具。最高16倍高品质放大,智能恢复细节、纹理和清晰度。

图像放大细节恢复降噪
工具

Topaz Video Upscaler

Topaz Labs

Topaz Labs的AI视频放大工具。高品质视频放大,以及帧插值、稳定和细节恢复功能。

视频放大帧插值稳定细节增强
图像

Gemini Image

Google

Google多模态AI驱动的图像生成模型。出色的文本理解力和知识驱动生成,创建准确、符合语境的视觉效果。

文本生图图像编辑文字渲染多模态理解
工具

Crystal Image

Morphic

Morphic自研AI图像放大技术。快速高效的图像放大,提升品质和清晰度。

图像放大细节增强快速处理
工具

Crystal Video

Morphic

Morphic自研AI视频放大技术。快速高效的视频放大,提升分辨率和品质。

视频放大帧插值快速处理
图像

Z-Image Turbo

fal.ai

超高速AI图像生成模型。接近实时的图像生成,适合快速原型和批量生成。

文本生图
多模态

Grok Imagine

xAI

xAI的AI图像生成模型。出色的提示词理解力和创意解读,将创意转化为高品质视觉效果。

文本生图图生图文生视频图生视频+1 更多
视频

Runway Gen-4 Aleph

Runway

Runway的Gen-4 AI视频生成模型。以旗舰级电影镜头和运动品质从文本和图像生成专业级视频。

文本生视频
视频

Seedance

ByteDance

字节跳动的AI视频生成模型。优秀的舞蹈和人物运动表现、流畅的动作品质,是人物视频和动态内容创作的理想选择。

文本生视频图像生视频帧生视频原生音频
视频

Hailuo AI 02

MiniMax

MiniMax的AI视频生成模型。自然的运动表现和逼真的视觉效果,从文本和图像生成高品质视频。

文本生视频图像生视频
图像

Seedream

ByteDance

字节跳动的旗舰AI图像生成模型。高度逼真、出色的美学品质和优秀的文字渲染,生成专业级图像。

文本生图图生图
图像

Kontext

Black Forest Labs

Black Forest Labs的上下文感知AI图像编辑模型。通过文本指令精确编辑图像,元素添加/删除、风格转换、局部修改。

图生图图像编辑替换背景风格迁移
视频

Runway Gen-4 Image

Runway

Runway的Gen-4 AI图像生成模型。以电影级视觉和出色的构图理解,为影视制作语境提供专业级图像生成。

文本生图
图像

GPT Image

OpenAI

OpenAI的AI图像生成模型,集成于GPT-4o。结合先进的语言理解和强大的图像生成能力,精确理解复杂提示并生成高品质视觉效果。

文本生图图生图文字渲染图像编辑
视频

Vidu Q2

Shengshu Technology

生数科技的AI视频生成模型。高品质文本生视频、图像生视频和快速处理速度。

文本生视频图像生视频参考生视频
视频

Kling Motion Control

Kling

快手的精确运动控制AI视频模型。直接控制镜头路径和运动轨迹,实现专业级精确运动视频生成。

文本生视频图像生视频运动控制
视频

Kling O1

Kling

快手的视频编辑专用AI模型。专注视频到视频变换,现有视频的风格转换、视觉重塑、保运动编辑。

视频转视频首末帧生视频风格迁移
图像

Flux

Black Forest Labs

Black Forest Labs的高品质AI图像生成模型。出色的提示词理解和多样化风格支持,是日常图像生成的最佳选择。

文本生图
视频

Luma

Luma AI

Luma AI的视频生成模型。高品质3D感知视频和自然的光照/空间表现,生成高度逼真的视觉效果。

文本生视频图像生视频
音频

ElevenLabs

ElevenLabs

ElevenLabs的旗舰AI语音合成技术。超自然的语音生成、语音克隆、29+语言支持,提供专业级语音内容。

文本转语音文本转音乐文本转音效文本转对话

模型指南

针对特定模型的教程、比较和讲解。

视频

ByteDance Bernini:AI 视频编辑与提示词完整指南

开源 AI 视频模型 ByteDance Bernini 的完整指南:功能、规格、一致性锁定,以及按任务划分的提示词结构。

图像

ChatGPT Images 2.0 在电商、营销和品牌建设中的应用场景

ChatGPT Images 2.0 应用场景的实用指南。了解如何用 GPT Image 2 创建产品视觉、多语言营销内容、品牌素材等。

视频

在 Morphic 上使用 Google 的 Gemini Omni

在 Morphic 上使用 Google 的 Gemini Omni。any-to-any 模型支持在一个 Prompt 中同时输入文本、图像、音频和视频,生成视频,并提供对话式编辑与 SynthID 水印。

视频

Happy Horse 1.0:提示词、功能与技巧完全指南

学习如何为 Happy Horse 1.0 编写提示词以获得最佳 AI 视频效果。涵盖功能、提示词技巧、镜头指令、音频以及 Morphic 上的最佳实践。

视频

Happy Horse 1.1:完整指南、提示词与功能

Morphic 上的 Happy Horse 1.1 完整指南:功能、规格、原生音频、reference-to-video,以及带示例的提示词写法。

视频

如何使用 Happy Horse 1.0 AI 视频生成器

在 Morphic 上使用 Happy Horse 1.0 AI 视频生成器的分步指南。几分钟内即可从文本或图像生成 AI 视频。

视频

Kling 3.0 Turbo 完整指南:提示词与功能

Morphic 上的 Kling 3.0 Turbo 完整指南:功能、规格、带示例的多镜头提示词,以及何时该选它而非 Kling 3.0。

视频

Seedance 2.0 4K:完整指南、提示词与功能

Morphic 上的 Seedance 2.0 4K 完整指南:原生 4K、规格、应用场景,以及带示例的提示词写法。