AI 模型
on Morphic

探索 Morphic 上所有可用的 AI 模型,从图像和视频生成到音频制作和画质增强。

icons
图像

Reve 2.0

Reve AI

Reve AI 的布局优先图像模型,也称 Reve Image 2。手动放置每个元素,像编辑设计文件一样修改结果,并以最高 4K 渲染清晰文字。

文本到图像基于布局的控制图像编辑多参考构图+2 更多
视频

Bernini

ByteDance

字节跳动的开源统一模型,用于 AI 视频编辑与生成。可在片段中添加、移除或重新风格化元素,未改动的区域保持不变,并支持保持身份一致的主体到视频。

视频编辑主体到视频参考引导编辑文本到视频+1 更多
视频

Grok Imagine v1.5

xAI

xAI在Morphic上的图像生成视频模型。将一张静态图像转化为带原生同步音频的片段,支持唇形同步对话、音效和音乐,并具备出色的Prompt遵循能力和视频续接。

图像生成视频文本生成视频原生同步音频唇形同步对话+4 更多
视频

Veo 4

Google DeepMind

Google DeepMind的下一代视频模型。Veo 4突破Veo 3.1的8秒上限,带来更长的原生4K片段、锁定的多镜头角色、分镜序列、电影级镜头语言和多说话人原生音频。

文本生视频图像生视频帧生视频参考生视频+5 更多
图像

MAI-Image-2.5

Microsoft

在 Morphic 上使用微软的文生图模型。MAI-Image-2.5 以第 3 名登上 Arena 文生图榜单,带来更清晰的文字渲染、风格化插画与商业级视觉,适配设计与品牌工作。

文生图图内文字渲染风格化插画商业视觉+4 更多
多模态

Gemini Omni

Google DeepMind

Google的any-to-any多模态模型,现已规划上线Morphic。Gemini Omni Flash将文本、图像、音频和视频融合为一段视频,支持角色一致性、精确物理、对话式编辑和SynthID水印。

any-to-any输入文本生成视频图像生成视频音频生成视频+6 更多
图像

Recraft V4.1 Pro

Recraft

Recraft 旗舰光栅层级,围绕更安静的写实、更柔和的渐变,以及像创意总监一样读懂短提示的模型重建。2K 原生输出,设计级构图。

文本生成图像图像生成图像
视频

Happy Horse 1.0

Alibaba

阿里巴巴的视频模型,一次生成同时输出视频与音频。支持7种语言的原生唇形同步、1080p输出、参考驱动控制,发布时在Artificial Analysis Video Arena的Elo榜上排名第一。

文本生成视频图像生成视频参考生成视频视频编辑+3 更多
图像

ChatGPT Images 2.0

OpenAI

OpenAI 的图像模型,具备原生推理、最高 2K 输出、保持角色一致的多图批量生成,以及面向图表、海报和设计工作的强大多语言文字渲染。

文本生成图像图像生成图像思考模式多图批量+2 更多
视频

Sync V3

Sync

Sync 的旗舰口型同步模型。Sync V3(sync-3)具备镜头级理解、遮挡处理和极端角度支持,生成无闪烁的 4K 口型同步。

口型同步音频驱动的视频生成
视频

Wan 2.7

Alibaba

阿里巴巴旗舰 Wan 视频模型,具备 Thinking Mode 提示推理、电影级 1080p 输出,以及跨镜头的参考驱动角色一致性。

文本生成视频图像生成视频参考生成视频视频编辑
视频

LTX 2.3

Lightricks

Lightricks 的开源音视频视频模型。LTX 2.3 在单次生成中同步产出视频和音频,原生竖屏输出最高可达 4K。

文本转视频图像转视频音频转视频原生音频生成
图像

Nano Banana 2

Google DeepMind

Google DeepMind 的 Gemini 3.1 Flash Image。以 Flash 速度实现专业级图像生成:在最多 5 个角色和 14 个对象间保持主体一致性、实时网络接地、精准文字渲染,以及最高 4K 的分辨率。

文字生成图像图像生成图像多轮编辑主体一致性+3 更多
视频

Kling 3.0

Kling

快手的提示词优先旗舰视频模型。Kling 3.0(V3)以原生 1080p 与 4K、30fps 提供照片级真实的运动、多镜头导演模式以及原生多语言音频。

文本生成视频图像生成视频多镜头导演模式原生音频
图像

Recraft V4 Pro

Recraft

Recraft 的高分辨率栅格图像模型,围绕设计品味、精细的人体表现、平衡的构图以及 2K 原生输出的版面级细节重新构建。

文本生成图像图像生成图像
图像

Seedream 5.0 Lite

ByteDance

字节跳动以推理为先的图像模型。Seedream 5.0 Lite 将深度思考生成与内置在线搜索结合,让与时事相关的提示词能够带着实时上下文呈现。

文本生成图像基于推理的生成在线搜索上下文
图像

Qwen Edit Angles

Alibaba Qwen

阿里巴巴的 Qwen-Image-Edit 多角度模型。从单张输入图像生成同一主体的不同相机视角,并保持几何结构、光照和身份一致。

图像到图像新视角合成相机感知编辑
视频

Seedance 1.5 Pro

ByteDance

字节跳动的原生音画视频模型。Seedance 1.5 Pro 一次生成即可输出同步的视频与音频,支持多语言唇形同步和电影级镜头控制。

文本生成视频图像生成视频原生音频生成多语言唇形同步
图像

Seedream 4.5

ByteDance

ByteDance 升级版图像模型,提升了提示词遵循度、多图参考处理与密集文字渲染,将文本生成图像与图像编辑统一到一个模型中。

文本生成图像图像生成图像多图参考
图像

Nano Banana Pro

Google DeepMind

Google DeepMind 的 Gemini 3 Pro Image。具备主体一致性、专业文字渲染、基于网络的准确性,以及 14 种宽高比下最高 4K 分辨率的工作室级图像生成与编辑。

文本生成图像图像生成图像多轮编辑主体一致性+3 更多
视频

Veed Fabric 1.0

Veed

Veed 的说话视频模型。Fabric 1.0 接收一张静态图像加一个音频文件,生成口型、头部、身体和手部动作同步的说话视频。

图像生成说话视频音频驱动动画口型同步
工具

Crystal Image

Morphic

Morphic自研AI图像放大技术。快速高效的图像放大,提升品质和清晰度。

图像放大
工具

Crystal Video

Morphic

Morphic自研AI视频放大技术。快速高效的视频放大,提升分辨率和品质。

视频放大
音频

ElevenLabs

ElevenLabs

ElevenLabs的旗舰AI语音合成技术。超自然的语音生成、语音克隆、29+语言支持,提供专业级语音内容。

文本转语音语音克隆
图像

Flux

Black Forest Labs

Black Forest Labs的高品质AI图像生成模型。出色的提示词理解和多样化风格支持,是日常图像生成的最佳选择。

文本生图
图像

Flux 2 Pro

Black Forest Labs

Black Forest Labs的旗舰AI图像生成模型。最高2K分辨率、精细的细节还原和出色的提示词理解力,是专业级图像生成的首选。

文本生图
图像

Gemini Image

Google

Google多模态AI驱动的图像生成模型。出色的文本理解力和知识驱动生成,创建准确、符合语境的视觉效果。

文本生图图像编辑
图像

Gemini Image Pro

Google

Google的旗舰AI图像生成模型。Gemini Image的所有功能加上更高分辨率、更精细细节和更高逼真度。

文本生图图像编辑
图像

GPT Image

OpenAI

OpenAI的AI图像生成模型,集成于GPT-4o。结合先进的语言理解和强大的图像生成能力,精确理解复杂提示并生成高品质视觉效果。

文本生图图像编辑
图像

Grok Imagine

xAI

xAI的AI图像生成模型。出色的提示词理解力和创意解读,将创意转化为高品质视觉效果。

文本生图
视频

Hailuo AI 02

MiniMax

MiniMax的AI视频生成模型。自然的运动表现和逼真的视觉效果,从文本和图像生成高品质视频。

文本生视频图像生视频
视频

Hailuo AI 2.3

MiniMax

MiniMax最新旗舰AI视频模型。更长时长、更高运动品质、更出色的视觉保真度,全面升级的视频生成体验。

文本生视频图像生视频
视频

Kling

快手

快手的旗舰AI视频生成模型(v2.6 Pro)。具有出色的运动质量、高保真视觉效果和灵活的输入方式,是目前最受欢迎的AI视频模型之一。

文本生视频图像生视频
视频

Kling Motion Control

快手

快手的精确运动控制AI视频模型。直接控制镜头路径和运动轨迹,实现专业级精确运动视频生成。

文本生视频图像生视频运动控制
视频

Kling O1

快手

快手的视频编辑专用AI模型。专注视频到视频变换,现有视频的风格转换、视觉重塑、保运动编辑。

视频转视频图像生视频
视频

Kling O3

快手

快手最新旗舰AI视频模型。支持文本、图像、参考图三种输入方式生成视频,Kling系列最高品质和最丰富功能。

文本生视频图像生视频参考图生视频
图像

Kontext

Black Forest Labs

Black Forest Labs的上下文感知AI图像编辑模型。通过文本指令精确编辑图像,元素添加/删除、风格转换、局部修改。

文本生图图像编辑
视频

Luma

Luma AI

Luma AI的视频生成模型。高品质3D感知视频和自然的光照/空间表现,生成高度逼真的视觉效果。

文本生视频图像生视频
视频

Runway Gen-4 Aleph

Runway

Runway的Gen-4 AI视频生成模型。以旗舰级电影镜头和运动品质从文本和图像生成专业级视频。

文本生视频图像生视频
图像

Runway Gen-4 Image

Runway

Runway的Gen-4 AI图像生成模型。以电影级视觉和出色的构图理解,为影视制作语境提供专业级图像生成。

文本生图
视频

Seedance

字节跳动

字节跳动的AI视频生成模型。优秀的舞蹈和人物运动表现、流畅的动作品质,是人物视频和动态内容创作的理想选择。

文本生视频图像生视频
视频

Seedance 2.0

ByteDance

字节跳动新一代多模态AI视频模型, 支持图片、视频、音频、文本同时输入。提供超逼真运动、可控摄像机运动、原生音频合成、音乐节拍同步和无缝视频延展,每次生成最多支持12个素材。

文本生成视频图片生成视频视频生成视频音频生成视频+7 更多
图像

Seedream

字节跳动

字节跳动的旗舰AI图像生成模型。高度逼真、出色的美学品质和优秀的文字渲染,生成专业级图像。

文本生图
视频

Sora

OpenAI

OpenAI的旗舰AI视频生成模型。将文本和图像转化为电影级视频,具有出色的物理模拟、叙事理解和画面品质。

文本生视频图像生视频
工具

Topaz Image Upscaler

Topaz Labs

Topaz Labs的AI图像放大工具。最高16倍高品质放大,智能恢复细节、纹理和清晰度。

图像放大
工具

Topaz Video Upscaler

Topaz Labs

Topaz Labs的AI视频放大工具。高品质视频放大,以及帧插值、稳定和细节恢复功能。

视频放大
视频

Veo 3.1

Google DeepMind

Google DeepMind的最新AI视频生成模型。行业领先的分辨率、精确的物理模拟和出色的时间一致性,代表了AI视频生成的技术前沿。

文本生视频图像生视频
视频

Vidu Q2

生数科技

生数科技的AI视频生成模型。高品质文本生视频、图像生视频和快速处理速度。

文本生视频图像生视频
视频

Vidu Q3

生数科技

生数科技最新AI视频模型。更高运动品质、更长时长、更出色的视觉保真度,全面升级的视频生成体验。

文本生视频图像生视频
视频

Wan 2.6

阿里巴巴

阿里巴巴的开源AI视频生成模型。优秀的性价比和稳定的品质,是日常视频生成的最佳选择。

文本生视频图像生视频
图像

Z-Image Turbo

Morphic

超高速AI图像生成模型。接近实时的图像生成,适合快速原型和批量生成。

文本生图