AI 模型
on Morphic
探索 Morphic 上所有可用的 AI 模型,从图像和视频生成到音频制作和画质增强。
Reve 2.0
Reve AI
Reve AI 的布局优先图像模型,也称 Reve Image 2。手动放置每个元素,像编辑设计文件一样修改结果,并以最高 4K 渲染清晰文字。
Bernini
ByteDance
字节跳动的开源统一模型,用于 AI 视频编辑与生成。可在片段中添加、移除或重新风格化元素,未改动的区域保持不变,并支持保持身份一致的主体到视频。
Grok Imagine v1.5
xAI
xAI在Morphic上的图像生成视频模型。将一张静态图像转化为带原生同步音频的片段,支持唇形同步对话、音效和音乐,并具备出色的Prompt遵循能力和视频续接。
Veo 4
Google DeepMind
Google DeepMind的下一代视频模型。Veo 4突破Veo 3.1的8秒上限,带来更长的原生4K片段、锁定的多镜头角色、分镜序列、电影级镜头语言和多说话人原生音频。
MAI-Image-2.5
Microsoft
在 Morphic 上使用微软的文生图模型。MAI-Image-2.5 以第 3 名登上 Arena 文生图榜单,带来更清晰的文字渲染、风格化插画与商业级视觉,适配设计与品牌工作。
Gemini Omni
Google DeepMind
Google的any-to-any多模态模型,现已规划上线Morphic。Gemini Omni Flash将文本、图像、音频和视频融合为一段视频,支持角色一致性、精确物理、对话式编辑和SynthID水印。
Recraft V4.1 Pro
Recraft
Recraft 旗舰光栅层级,围绕更安静的写实、更柔和的渐变,以及像创意总监一样读懂短提示的模型重建。2K 原生输出,设计级构图。
Happy Horse 1.0
Alibaba
阿里巴巴的视频模型,一次生成同时输出视频与音频。支持7种语言的原生唇形同步、1080p输出、参考驱动控制,发布时在Artificial Analysis Video Arena的Elo榜上排名第一。
ChatGPT Images 2.0
OpenAI
OpenAI 的图像模型,具备原生推理、最高 2K 输出、保持角色一致的多图批量生成,以及面向图表、海报和设计工作的强大多语言文字渲染。
Sync V3
Sync
Sync 的旗舰口型同步模型。Sync V3(sync-3)具备镜头级理解、遮挡处理和极端角度支持,生成无闪烁的 4K 口型同步。
Wan 2.7
Alibaba
阿里巴巴旗舰 Wan 视频模型,具备 Thinking Mode 提示推理、电影级 1080p 输出,以及跨镜头的参考驱动角色一致性。
LTX 2.3
Lightricks
Lightricks 的开源音视频视频模型。LTX 2.3 在单次生成中同步产出视频和音频,原生竖屏输出最高可达 4K。
Nano Banana 2
Google DeepMind
Google DeepMind 的 Gemini 3.1 Flash Image。以 Flash 速度实现专业级图像生成:在最多 5 个角色和 14 个对象间保持主体一致性、实时网络接地、精准文字渲染,以及最高 4K 的分辨率。
Kling 3.0
Kling
快手的提示词优先旗舰视频模型。Kling 3.0(V3)以原生 1080p 与 4K、30fps 提供照片级真实的运动、多镜头导演模式以及原生多语言音频。
Recraft V4 Pro
Recraft
Recraft 的高分辨率栅格图像模型,围绕设计品味、精细的人体表现、平衡的构图以及 2K 原生输出的版面级细节重新构建。
Seedream 5.0 Lite
ByteDance
字节跳动以推理为先的图像模型。Seedream 5.0 Lite 将深度思考生成与内置在线搜索结合,让与时事相关的提示词能够带着实时上下文呈现。
Qwen Edit Angles
Alibaba Qwen
阿里巴巴的 Qwen-Image-Edit 多角度模型。从单张输入图像生成同一主体的不同相机视角,并保持几何结构、光照和身份一致。
Seedance 1.5 Pro
ByteDance
字节跳动的原生音画视频模型。Seedance 1.5 Pro 一次生成即可输出同步的视频与音频,支持多语言唇形同步和电影级镜头控制。
Seedream 4.5
ByteDance
ByteDance 升级版图像模型,提升了提示词遵循度、多图参考处理与密集文字渲染,将文本生成图像与图像编辑统一到一个模型中。
Nano Banana Pro
Google DeepMind
Google DeepMind 的 Gemini 3 Pro Image。具备主体一致性、专业文字渲染、基于网络的准确性,以及 14 种宽高比下最高 4K 分辨率的工作室级图像生成与编辑。
Veed Fabric 1.0
Veed
Veed 的说话视频模型。Fabric 1.0 接收一张静态图像加一个音频文件,生成口型、头部、身体和手部动作同步的说话视频。
Crystal Image
Morphic
Morphic自研AI图像放大技术。快速高效的图像放大,提升品质和清晰度。
Crystal Video
Morphic
Morphic自研AI视频放大技术。快速高效的视频放大,提升分辨率和品质。
ElevenLabs
ElevenLabs
ElevenLabs的旗舰AI语音合成技术。超自然的语音生成、语音克隆、29+语言支持,提供专业级语音内容。
Flux
Black Forest Labs
Black Forest Labs的高品质AI图像生成模型。出色的提示词理解和多样化风格支持,是日常图像生成的最佳选择。
Flux 2 Pro
Black Forest Labs
Black Forest Labs的旗舰AI图像生成模型。最高2K分辨率、精细的细节还原和出色的提示词理解力,是专业级图像生成的首选。
Gemini Image
Google多模态AI驱动的图像生成模型。出色的文本理解力和知识驱动生成,创建准确、符合语境的视觉效果。
Gemini Image Pro
Google的旗舰AI图像生成模型。Gemini Image的所有功能加上更高分辨率、更精细细节和更高逼真度。
GPT Image
OpenAI
OpenAI的AI图像生成模型,集成于GPT-4o。结合先进的语言理解和强大的图像生成能力,精确理解复杂提示并生成高品质视觉效果。
Grok Imagine
xAI
xAI的AI图像生成模型。出色的提示词理解力和创意解读,将创意转化为高品质视觉效果。
Hailuo AI 02
MiniMax
MiniMax的AI视频生成模型。自然的运动表现和逼真的视觉效果,从文本和图像生成高品质视频。
Hailuo AI 2.3
MiniMax
MiniMax最新旗舰AI视频模型。更长时长、更高运动品质、更出色的视觉保真度,全面升级的视频生成体验。
Kling
快手
快手的旗舰AI视频生成模型(v2.6 Pro)。具有出色的运动质量、高保真视觉效果和灵活的输入方式,是目前最受欢迎的AI视频模型之一。
Kling Motion Control
快手
快手的精确运动控制AI视频模型。直接控制镜头路径和运动轨迹,实现专业级精确运动视频生成。
Kling O1
快手
快手的视频编辑专用AI模型。专注视频到视频变换,现有视频的风格转换、视觉重塑、保运动编辑。
Kling O3
快手
快手最新旗舰AI视频模型。支持文本、图像、参考图三种输入方式生成视频,Kling系列最高品质和最丰富功能。
Kontext
Black Forest Labs
Black Forest Labs的上下文感知AI图像编辑模型。通过文本指令精确编辑图像,元素添加/删除、风格转换、局部修改。
Luma
Luma AI
Luma AI的视频生成模型。高品质3D感知视频和自然的光照/空间表现,生成高度逼真的视觉效果。
Runway Gen-4 Aleph
Runway
Runway的Gen-4 AI视频生成模型。以旗舰级电影镜头和运动品质从文本和图像生成专业级视频。
Runway Gen-4 Image
Runway
Runway的Gen-4 AI图像生成模型。以电影级视觉和出色的构图理解,为影视制作语境提供专业级图像生成。
Seedance
字节跳动
字节跳动的AI视频生成模型。优秀的舞蹈和人物运动表现、流畅的动作品质,是人物视频和动态内容创作的理想选择。
Seedance 2.0
ByteDance
字节跳动新一代多模态AI视频模型, 支持图片、视频、音频、文本同时输入。提供超逼真运动、可控摄像机运动、原生音频合成、音乐节拍同步和无缝视频延展,每次生成最多支持12个素材。
Seedream
字节跳动
字节跳动的旗舰AI图像生成模型。高度逼真、出色的美学品质和优秀的文字渲染,生成专业级图像。
Sora
OpenAI
OpenAI的旗舰AI视频生成模型。将文本和图像转化为电影级视频,具有出色的物理模拟、叙事理解和画面品质。
Topaz Image Upscaler
Topaz Labs
Topaz Labs的AI图像放大工具。最高16倍高品质放大,智能恢复细节、纹理和清晰度。
Topaz Video Upscaler
Topaz Labs
Topaz Labs的AI视频放大工具。高品质视频放大,以及帧插值、稳定和细节恢复功能。
Veo 3.1
Google DeepMind
Google DeepMind的最新AI视频生成模型。行业领先的分辨率、精确的物理模拟和出色的时间一致性,代表了AI视频生成的技术前沿。
Vidu Q2
生数科技
生数科技的AI视频生成模型。高品质文本生视频、图像生视频和快速处理速度。
Vidu Q3
生数科技
生数科技最新AI视频模型。更高运动品质、更长时长、更出色的视觉保真度,全面升级的视频生成体验。
Wan 2.6
阿里巴巴
阿里巴巴的开源AI视频生成模型。优秀的性价比和稳定的品质,是日常视频生成的最佳选择。
Z-Image Turbo
Morphic
超高速AI图像生成模型。接近实时的图像生成,适合快速原型和批量生成。
模型指南
针对特定模型的教程、比较和讲解。
ByteDance Bernini:AI 视频编辑与提示词完整指南
开源 AI 视频模型 ByteDance Bernini 的完整指南:功能、规格、一致性锁定,以及按任务划分的提示词结构。
ChatGPT Images 2.0 在电商、营销和品牌建设中的应用场景
ChatGPT Images 2.0 应用场景的实用指南。了解如何用 GPT Image 2 创建产品视觉、多语言营销内容、品牌素材等。
在 Morphic 上使用 Google 的 Gemini Omni
在 Morphic 上使用 Google 的 Gemini Omni。any-to-any 模型支持在一个 Prompt 中同时输入文本、图像、音频和视频,生成视频,并提供对话式编辑与 SynthID 水印。
Happy Horse 1.0:提示词、功能与技巧完全指南
学习如何为 Happy Horse 1.0 编写提示词以获得最佳 AI 视频效果。涵盖功能、提示词技巧、镜头指令、音频以及 Morphic 上的最佳实践。
如何使用 Happy Horse 1.0 AI 视频生成器
在 Morphic 上使用 Happy Horse 1.0 AI 视频生成器的分步指南。几分钟内即可从文本或图像生成 AI 视频。