AI 模型
on Morphic
探索 Morphic 上所有可用的 AI 模型,从图像和视频生成到音频制作和画质增强。
Seed Audio 1.0
ByteDance
Seed Audio 1.0 是字节跳动的一体化音频模型:在一次生成中同时产出语音、音效和背景音乐,超越传统的文本转语音。
Seedance 2.0 4K
ByteDance
字节跳动的 Seedance 2.0 现在可在 Morphic 上以原生 4K 生成。锐利的细节与干净的纹理在运动中保持稳定,并支持多模态输入、原生音频和可控的镜头运动。
Seedance 2.5
ByteDance
Seedance 2.5 是字节跳动的新一代视频模型:单镜头原生视频最长 30 秒,最多 50 个多模态参考,更强的片段内编辑,以及 720p 到 4K 输出。
Seedream 5.0 Pro
ByteDance
Seedream 5.0 Pro 是字节跳动的新一代图像模型:精准的分层编辑、深度思考生成、内置联网搜索,输出干净到足以用作 Seedance 视频的参考。
Happy Horse 1.1
Alibaba
Morphic 上的阿里巴巴音视频联合模型。Happy Horse 1.1 在一次生成中同时产出视频和同步音频,支持原生多语种口型同步、最多 9 个主体的 reference-to-video,以及九种画幅比例。
Kling 3.0 Turbo
Kling
快手在 Morphic 上推出的速度优化版 Kling 视频模型。Kling 3.0 Turbo 保持出色的提示词还原度和多镜头一致性,同时在 720p 和 1080p 下快速生成。
Seedance 2.0 Mini
ByteDance
ByteDance 的轻量 Seedance 2.0 档位。支持图像、视频和音频多模态参考,最高 1080p,价格约为 Seedance 2.0 的一半。
Ideogram 4.0
Ideogram
Ideogram 的开源权重图像模型。顶尖的图内文字渲染、边界框版面控制、结构化 JSON 提示词,以及附商用许可的 2K 输出。
Reve 2.0
Reve AI
Reve AI 的布局优先图像模型,也称 Reve Image 2。手动放置每个元素,像编辑设计文件一样修改结果,并以最高 4K 渲染清晰文字。
Bernini
ByteDance
字节跳动的开源统一模型,用于 AI 视频编辑与生成。可在片段中添加、移除或重新风格化元素,未改动的区域保持不变,并支持保持身份一致的主体到视频。
Grok Imagine v1.5
xAI
xAI在Morphic上的图像生成视频模型。将一张静态图像转化为带原生同步音频的片段,支持唇形同步对话、音效和音乐,并具备出色的Prompt遵循能力和视频续接。
Veo 4
Google DeepMind
Google DeepMind的下一代视频模型。Veo 4突破Veo 3.1的8秒上限,带来更长的原生4K片段、锁定的多镜头角色、分镜序列、电影级镜头语言和多说话人原生音频。
MAI-Image-2.5
Microsoft
在 Morphic 上使用微软的文生图模型。MAI-Image-2.5 以第 3 名登上 Arena 文生图榜单,带来更清晰的文字渲染、风格化插画与商业级视觉,适配设计与品牌工作。
Gemini Omni
Google DeepMind
Google的any-to-any多模态模型,现已规划上线Morphic。Gemini Omni Flash将文本、图像、音频和视频融合为一段视频,支持角色一致性、精确物理、对话式编辑和SynthID水印。
Recraft V4.1 Pro
Recraft
Recraft 旗舰光栅层级,围绕更安静的写实、更柔和的渐变,以及像创意总监一样读懂短提示的模型重建。2K 原生输出,设计级构图。
Krea 2
Krea AI
Krea AI 首个从零打造的基础图像模型现已登陆 Morphic,专为美感与创作把控而生。支持参考图风格迁移、情绪板、创意调节,从颗粒胶片到干净的影棚写实,覆盖广泛风格。
Happy Horse 1.0
Alibaba
阿里巴巴的视频模型,一次生成同时输出视频与音频。支持7种语言的原生唇形同步、1080p输出、参考驱动控制,发布时在Artificial Analysis Video Arena的Elo榜上排名第一。
ChatGPT Images 2.0
OpenAI
OpenAI 的图像模型,具备原生推理、最高 2K 输出、保持角色一致的多图批量生成,以及面向图表、海报和设计工作的强大多语言文字渲染。
Gemini 3.1 Flash TTS
Google DeepMind
Google 在 Morphic 上最具表现力的文本转语音模型。Gemini 3.1 Flash TTS 将文本转化为自然、可调度的旁白,提供内嵌音频标签、多人对话和 SynthID 水印,并支持多种语言。
Sync V3
Sync
Sync 的旗舰口型同步模型。Sync V3(sync-3)具备镜头级理解、遮挡处理和极端角度支持,生成无闪烁的 4K 口型同步。
Wan 2.7
Alibaba
阿里巴巴旗舰 Wan 视频模型,具备 Thinking Mode 提示推理、电影级 1080p 输出,以及跨镜头的参考驱动角色一致性。
LTX 2.3
Lightricks
Lightricks 的开源音视频视频模型。LTX 2.3 在单次生成中同步产出视频和音频,原生竖屏输出最高可达 4K。
Nano Banana 2
Google DeepMind
Google DeepMind 的 Gemini 3.1 Flash Image。以 Flash 速度实现专业级图像生成:在最多 5 个角色和 14 个对象间保持主体一致性、实时网络接地、精准文字渲染,以及最高 4K 的分辨率。
Kling 3.0
Kling
快手的提示词优先旗舰视频模型。Kling 3.0(V3)以原生 1080p 与 4K、30fps 提供照片级真实的运动、多镜头导演模式以及原生多语言音频。
Recraft V4 Pro
Recraft
Recraft 的高分辨率栅格图像模型,围绕设计品味、精细的人体表现、平衡的构图以及 2K 原生输出的版面级细节重新构建。
Seedream 5.0 Lite
ByteDance
字节跳动以推理为先的图像模型。Seedream 5.0 Lite 将深度思考生成与内置在线搜索结合,让与时事相关的提示词能够带着实时上下文呈现。
Qwen Edit Angles
Alibaba Qwen
阿里巴巴的 Qwen-Image-Edit 多角度模型。从单张输入图像生成同一主体的不同相机视角,并保持几何结构、光照和身份一致。
Seedance 1.5 Pro
ByteDance
字节跳动的原生音画视频模型。Seedance 1.5 Pro 一次生成即可输出同步的视频与音频,支持多语言唇形同步和电影级镜头控制。
Seedream 4.5
ByteDance
ByteDance 升级版图像模型,提升了提示词遵循度、多图参考处理与密集文字渲染,将文本生成图像与图像编辑统一到一个模型中。
Seedance 2.0
ByteDance
字节跳动新一代多模态AI视频模型, 支持图片、视频、音频、文本同时输入。提供超逼真运动、可控摄像机运动、原生音频合成、音乐节拍同步和无缝视频延展,每次生成最多支持12个素材。
Flux 2 Pro
Black Forest Labs
Black Forest Labs的旗舰AI图像生成模型。最高2K分辨率、精细的细节还原和出色的提示词理解力,是专业级图像生成的首选。
Gemini Image Pro
Google的旗舰AI图像生成模型。Gemini Image的所有功能加上更高分辨率、更精细细节和更高逼真度。
Nano Banana Pro
Google DeepMind
Google DeepMind 的 Gemini 3 Pro Image。具备主体一致性、专业文字渲染、基于网络的准确性,以及 14 种宽高比下最高 4K 分辨率的工作室级图像生成与编辑。
Hailuo AI 2.3
MiniMax
MiniMax最新旗舰AI视频模型。更长时长、更高运动品质、更出色的视觉保真度,全面升级的视频生成体验。
Wan 2.6
Alibaba
阿里巴巴的开源AI视频生成模型。优秀的性价比和稳定的品质,是日常视频生成的最佳选择。
Veed Fabric 1.0
Veed
Veed 的说话视频模型。Fabric 1.0 接收一张静态图像加一个音频文件,生成口型、头部、身体和手部动作同步的说话视频。
Vidu Q3
Shengshu Technology
生数科技最新AI视频模型。更高运动品质、更长时长、更出色的视觉保真度,全面升级的视频生成体验。
Veo 3.1
Google DeepMind
Google DeepMind的最新AI视频生成模型。行业领先的分辨率、精确的物理模拟和出色的时间一致性,代表了AI视频生成的技术前沿。
Sora
OpenAI
OpenAI的旗舰AI视频生成模型。将文本和图像转化为电影级视频,具有出色的物理模拟、叙事理解和画面品质。
Kling O3
Kling
快手最新旗舰AI视频模型。支持文本、图像、参考图三种输入方式生成视频,Kling系列最高品质和最丰富功能。
Kling
Kling
快手的旗舰AI视频生成模型(v2.6 Pro)。具有出色的运动质量、高保真视觉效果和灵活的输入方式,是目前最受欢迎的AI视频模型之一。
Topaz Image Upscaler
Topaz Labs
Topaz Labs的AI图像放大工具。最高16倍高品质放大,智能恢复细节、纹理和清晰度。
Topaz Video Upscaler
Topaz Labs
Topaz Labs的AI视频放大工具。高品质视频放大,以及帧插值、稳定和细节恢复功能。
Gemini Image
Google多模态AI驱动的图像生成模型。出色的文本理解力和知识驱动生成,创建准确、符合语境的视觉效果。
Crystal Image
Morphic
Morphic自研AI图像放大技术。快速高效的图像放大,提升品质和清晰度。
Crystal Video
Morphic
Morphic自研AI视频放大技术。快速高效的视频放大,提升分辨率和品质。
Z-Image Turbo
fal.ai
超高速AI图像生成模型。接近实时的图像生成,适合快速原型和批量生成。
Grok Imagine
xAI
xAI的AI图像生成模型。出色的提示词理解力和创意解读,将创意转化为高品质视觉效果。
Runway Gen-4 Aleph
Runway
Runway的Gen-4 AI视频生成模型。以旗舰级电影镜头和运动品质从文本和图像生成专业级视频。
Seedance
ByteDance
字节跳动的AI视频生成模型。优秀的舞蹈和人物运动表现、流畅的动作品质,是人物视频和动态内容创作的理想选择。
Hailuo AI 02
MiniMax
MiniMax的AI视频生成模型。自然的运动表现和逼真的视觉效果,从文本和图像生成高品质视频。
Seedream
ByteDance
字节跳动的旗舰AI图像生成模型。高度逼真、出色的美学品质和优秀的文字渲染,生成专业级图像。
Kontext
Black Forest Labs
Black Forest Labs的上下文感知AI图像编辑模型。通过文本指令精确编辑图像,元素添加/删除、风格转换、局部修改。
Runway Gen-4 Image
Runway
Runway的Gen-4 AI图像生成模型。以电影级视觉和出色的构图理解,为影视制作语境提供专业级图像生成。
GPT Image
OpenAI
OpenAI的AI图像生成模型,集成于GPT-4o。结合先进的语言理解和强大的图像生成能力,精确理解复杂提示并生成高品质视觉效果。
Vidu Q2
Shengshu Technology
生数科技的AI视频生成模型。高品质文本生视频、图像生视频和快速处理速度。
Kling Motion Control
Kling
快手的精确运动控制AI视频模型。直接控制镜头路径和运动轨迹,实现专业级精确运动视频生成。
Kling O1
Kling
快手的视频编辑专用AI模型。专注视频到视频变换,现有视频的风格转换、视觉重塑、保运动编辑。
Flux
Black Forest Labs
Black Forest Labs的高品质AI图像生成模型。出色的提示词理解和多样化风格支持,是日常图像生成的最佳选择。
Luma
Luma AI
Luma AI的视频生成模型。高品质3D感知视频和自然的光照/空间表现,生成高度逼真的视觉效果。
ElevenLabs
ElevenLabs
ElevenLabs的旗舰AI语音合成技术。超自然的语音生成、语音克隆、29+语言支持,提供专业级语音内容。
模型指南
针对特定模型的教程、比较和讲解。
ByteDance Bernini:AI 视频编辑与提示词完整指南
开源 AI 视频模型 ByteDance Bernini 的完整指南:功能、规格、一致性锁定,以及按任务划分的提示词结构。
ChatGPT Images 2.0 在电商、营销和品牌建设中的应用场景
ChatGPT Images 2.0 应用场景的实用指南。了解如何用 GPT Image 2 创建产品视觉、多语言营销内容、品牌素材等。
在 Morphic 上使用 Google 的 Gemini Omni
在 Morphic 上使用 Google 的 Gemini Omni。any-to-any 模型支持在一个 Prompt 中同时输入文本、图像、音频和视频,生成视频,并提供对话式编辑与 SynthID 水印。
Happy Horse 1.0:提示词、功能与技巧完全指南
学习如何为 Happy Horse 1.0 编写提示词以获得最佳 AI 视频效果。涵盖功能、提示词技巧、镜头指令、音频以及 Morphic 上的最佳实践。
Happy Horse 1.1:完整指南、提示词与功能
Morphic 上的 Happy Horse 1.1 完整指南:功能、规格、原生音频、reference-to-video,以及带示例的提示词写法。
如何使用 Happy Horse 1.0 AI 视频生成器
在 Morphic 上使用 Happy Horse 1.0 AI 视频生成器的分步指南。几分钟内即可从文本或图像生成 AI 视频。
Kling 3.0 Turbo 完整指南:提示词与功能
Morphic 上的 Kling 3.0 Turbo 完整指南:功能、规格、带示例的多镜头提示词,以及何时该选它而非 Kling 3.0。
Seedance 2.0 4K:完整指南、提示词与功能
Morphic 上的 Seedance 2.0 4K 完整指南:原生 4K、规格、应用场景,以及带示例的提示词写法。