模型 (AI)

模型 (AI)是什么?

AI 模型是一个经过训练的系统,它从海量数据中习得了模式,现在能运用这些模式根据提示词生成新内容(图像、视频、文本或音频)。

一图看懂

别称
AI 模型基础模型生成式模型神经网络模型
主要用途
根据提示词生成图像、视频、文本与音频分类、预测与分析任务每一款 AI 生成工具与平台的核心引擎
常用工具
Stable diffusionFluxMidjourneyGPT-4ClaudeKlingSora
相关术语
Neural networkDiffusion modelTrainingFine-tuningInferenceParameters
How it works in simple terms
模型通过接触大量已知正确输出的示例进行训练,反复调整其内部数值参数,直到能够可靠地复现正确输出。在推理时,它将这些习得的参数应用于此前从未见过的新输入,以产出输出。
Where you encounter this
每一款 AI 生成工具(Midjourney、Stable Diffusion、ChatGPT、Claude、Kling、Runway)都构建在一个或多个模型之上。当某个平台让你在不同的模型版本或选项间做选择时,你就是在为自己的生成挑选使用哪个被训练好的系统。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

对比与差异

对比与差异

Compared with related concepts

'模型''AI'与'算法'这几个术语在日常用语中常被混用,但具有不同的技术含义。算法是一组用于解决问题的指令或规则。AI 是表现出智能行为的系统的宽泛类别。模型是一个具体的被训练产物:由特定训练过程得出、具有固定参数的某个神经网络实例。当人们说'AI'生成了一张图像时,通常指的是一个以特定方式训练、产出具有该训练特征输出的具体模型。


可以这样理解…

AI 模型就像一位花了数年聆听浩瀚音乐库的音乐家:不是去阅读乐理规则,而是通过海量聆听吸收模式。当被要求演奏一首新曲时,他会调动所有内化的模式,产出反映其所听一切、并应用于新任务的作品。


实用提示

在探索 AI 生成平台时,要去了解可用模型各自的具体优势与特性,而不要把它们当作可以随意互换的。一个主要在电影摄影上训练的模型,即便面对完全相同的提示词,也会产出与一个在插画或动画上训练的模型不同的结果。让模型与项目的美学目标相匹配,与撰写最详尽的提示词同样重要,而且往往比强行让模型产出它没有被训练去产出的风格更高效。

类型与变体

AI 模型在模态与架构上差异很大。图像生成模型(Stable Diffusion、Flux、Midjourney、DALL·E)根据文本或图像输入生成图像。视频生成模型(Kling、Runway Gen-3、Sora、HunyuanVideo)根据文本或图像提示词生成视频。语言模型(GPT-4、Claude、Gemini)生成文本并对文本进行推理。多模态模型在单一系统内接受并产出多种模态(文本、图像、音频)。基础模型是在广覆盖数据上训练的大规模模型,可被适配到特定任务。微调模型是在专门数据上进一步训练的基础模型,以提升在特定领域或风格上的表现。

准备好在 Morphic 里做第一个场景了吗?

试用 Morphic

常见使用场景

模型是所有 AI 生成背后的基础技术层:图像创建、视频生成、文本撰写与编辑、音频合成、代码生成、图像与视频分析、翻译、摘要,以及当前由 AI 系统执行的任何其他任务。在用户层面,模型选择是一项主要的创作决定:为某项生成任务选择使用哪个模型,类似于选择使用哪种工具或媒介,因为不同模型会产出截然不同的美学结果,并以不同的能力水平处理不同类型的任务。

准备好开始创作了吗?

执导场景、设计角色、完成整部影片

一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。

常见问题(FAQ)

什么是 AI 模型?

AI 模型是一个在大量数据上训练、以学习模式与关系的计算系统,随后它能应用这些模式,根据新输入产出输出。它是每一款 AI 生成工具背后的核心技术:将提示词转化为图像、视频、文本或其他输出的被训练引擎。

AI 模型是如何学习的?

AI 模型通过一个训练过程进行学习,在此过程中它接触大量已知正确输出的示例,其内部参数(数十亿个数值)被反复调整以最小化误差。训练完成后,参数被固定,模型在推理时将其习得的表征应用于新输入。

模型与 AI 工具或平台有何区别?

模型是底层的被训练系统:即引擎。AI 工具或平台是构建在一个或多个模型之上的界面与产品。Midjourney 是一个平台;它所使用的模型才是真正生成图像的部分。许多平台提供多个模型版本或选项,每一个都代表一个具有不同能力与美学的不同被训练系统。

为什么不同的 AI 模型会产出如此不同的结果?

模型产出不同结果,是因为它们有不同的架构、训练数据、训练目标与微调。一个主要在摄影影像上训练的模型,会产出与一个在插画或特定艺术风格上训练的模型不同的输出。一个为照片级真实优化的模型,即便面对完全相同的提示词,也会产出与一个为风格化优化的模型不同的结果。

平台发布新模型版本意味着什么?

新模型版本代表一个具有不同参数的重新训练或微调系统:通常在更多数据上训练、带有架构改进,或为特定能力的提升而优化。新版本通常在关键基准上产出更好的结果,但与之前的版本相比,也可能具有不同的风格倾向或行为。用户在切换模型版本时往往需要调整提示词策略。

什么是基础模型?

基础模型是在广泛、多样的数据集上训练的大规模 AI 模型(往往耗费巨大的算力),可作为各种下游应用的基底。它们可以直接使用,也可以为特定任务与领域进行微调。GPT-4、Stable Diffusion 与 CLIP 都是基础模型的例子。大多数面向用户的 AI 工具都构建于或衍生自基础模型。

我该如何为某项生成任务选择合适的模型?

先根据模态选择(图像、视频、文本、音频),再看其美学与能力是否与你的目标契合。研究哪些模型以你所需的特定视觉风格、质量水平或任务类型著称。用相同的提示词测试多个模型,观察它们各自的不同倾向。阅读平台关于每个模型为何而优化的文档。随着时间推移,对具体模型特征输出的熟悉会让模型选择成为你工作流中直觉且迅速的一环。

模型规模与其能力之间是什么关系?

模型规模(通常以参数数量衡量)总体上与能力相关,但这种关系并非线性或简单。更大的模型具有更强的表征能力,往往产出更协调、更细致、更有能力的输出。然而,一个在高度精选、领域特定数据上训练的较小模型,在该领域的特定任务上可能胜过一个更大的通用模型。架构创新也能在给定规模下提升能力。能力还在很大程度上取决于训练数据的质量,而不仅是数量。

Can't find what you are looking for?
Contact us and let us know.
bg