生成式人工智能
生成式人工智能是什么?
生成式 AI 是一种软件,它通过研究海量已有样本来学习创造与之相似的全新内容(图片、视频、音乐或文本)。
一图看懂
- 别称
- GenAI生成式模型创意 AI
- 主要用途
- 根据提示词生成图像、视频、音频和文本自动化创意生产任务创建合成训练数据大规模个性化内容
- 常用工具
- MidjourneyRunwayStable diffusionChatGPTClaudeElevenLabsSora
- 相关术语
- Diffusion modelLarge language modelPrompt engineeringFine-tuningLatent space
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
生成式 AI 与判别式 AI 的区别:生成式 AI 学习的是生成某一数据分布的全新样本(创造图像、文本或音频),而判别式 AI 学习的是对已有数据的类别进行分类或区分,例如判断一张图像中是否包含猫。这两种方法都被用于现代 AI 系统中,生成模型在训练过程中也常常会引入判别式组件。
实用提示
在使用生成式 AI 工具时,提示词的具体程度会显著提升输出质量。与其描述一个笼统的主题,不如加入关于风格、灯光、构图、媒介和氛围的细节。提示词越接近训练数据中常见的语言(例如美术指导笔记、摄影简报或剧本描述),模型就越能稳定地生成符合你意图的结果。
类型与变体
生成式 AI 涵盖多种不同的模型类型,每一种都适用于不同的内容模态。文生图模型根据语言描述生成视觉内容。文生视频模型根据提示词生成活动影像,或对已有片段进行延展。大型语言模型根据对话式输入生成文本、代码和结构化数据。音频生成模型生成音乐、音效和合成语音。多模态模型可同时处理多种类型的输入和输出,例如同时接受一张图像和一段文本提示,生成相关的图像或描述。每个类别都在快速演进,各代模型之间的能力差距正逐年大幅缩小。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
生成式 AI 被广泛应用于市场营销、娱乐、教育、软件开发和科研领域。创意团队使用图像和视频生成器来快速构建概念原型、生成故事板,并大规模生产素材。文案和内容团队使用语言模型进行起草、编辑和摘要。软件开发者使用 AI 编程助手来加速开发流程。在影视和媒体制作中,生成式 AI 让小型团队也能制作出此前需要庞大专业团队才能完成的视觉特效、合成配音和动画内容。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
生成式 AI 是指经过训练能够生成全新内容(例如图像、文本、视频和音频)的人工智能系统,其原理是从大规模数据集中学习规律。与对已有信息进行分类或分析的系统不同,生成式 AI 会根据提示词或输入信号创造出全新的输出。
传统 AI 系统通常被设计用于基于已有数据进行分类、预测或优化,例如识别垃圾邮件或推荐商品。生成式 AI 则更进一步,它利用学到的规律合成原创输出,生成训练数据中并不存在的全新内容。
主要架构包括:扩散模型,通过学习逆转加噪过程来生成图像;基于 Transformer 的大型语言模型,用于生成文本;生成对抗网络,通过让两个神经网络相互对抗来生成逼真的输出;以及变分自编码器,通过学习数据的压缩表征来进行生成。
生成式 AI 与通用人工智能(AGI)是两个不同的概念。生成式 AI 描述的是一类在特定模态内生成内容的系统,例如文本或图像生成。AGI 则指一种假想中的未来系统,能够以人类水平在任何智力任务上进行推理和学习,而这种系统目前尚不存在。
生成式 AI 引发了关于知识产权的顾虑,因为模型所基于的训练数据可能包含受版权保护的素材。它还带来了关于虚假信息、深度伪造内容以及创意工作者被替代的风险。负责任地使用意味着对内容创作中 AI 的参与保持透明,并对训练数据的来源保持清醒认识。
生成式 AI 能够自动化并加速许多创意生产任务,但它的运作方式是对训练数据中的规律进行重组,而非从亲身经历中提炼出意义。人类创造力包含意图、文化语境、情感智慧和原创性,这些是当前生成模型无法复制的,因此即使在 AI 辅助的工作流程中,人类的创意角色依然处于核心地位。
包括影视、广告、音乐、游戏和出版在内的创意行业,已经因生成式 AI 而受到深刻冲击。随着语言模型和其他生成工具被整合进专业工作流程,软件开发、客户服务、市场营销、教育和医疗等领域也正经历重大变革。
撰写详尽、具体的提示词能稳定地提升输出质量。加入关于风格、媒介、灯光、氛围、构图和目标受众的信息,能为模型提供更多可发挥的素材。对提示词进行迭代、在支持的情况下使用参考图,以及尝试调整引导系数或温度等特定于模型的参数,也都有助于优化结果。