神经网络
神经网络是什么?
神经网络是由数学连接构成的分层系统,它从数据中学习模式(如同大脑从经验中学习),并利用这些模式生成图像、文本或视频等新输出。
一图看懂
- 别称
- 人工神经网络(ANN)深度神经网络(DNN)深度学习模型
- 主要用途
- 从大规模数据集中学习模式,以实现预测与生成所有现代 AI 生成系统的基础架构图像识别、自然语言处理、语音合成、生成式 AI
- 常用工具
- TensorFlowPyTorchAll AI generation models (stable diffusion, GPT, CLIP, etc.)
- 相关术语
- Deep learningDiffusion modelTransformerGANTrainingParametersModel
- How it works in simple terms
- 数据进入网络,穿过多层相互连接的处理单元,每一层都以已学的方式对其进行变换,最终从末层产出输出。在训练过程中,这些连接被调整数百万乃至数十亿次以最小化误差。训练完成后,调整好的连接便编码了网络所学到的一切。
- Where you encounter this
- 每一款 AI 生成工具:图像生成器、视频生成器、聊天机器人、语音合成系统:都建立在一个或多个神经网络之上。当你提示 AI 生成图像或视频时,你正是在通过一个神经网络发送输入,由它将其变换为输出。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
神经网络常被与经典机器学习及基于规则的 AI 系统相对照。基于规则的系统编码由人手写的显式规则来产生输出;它们透明且可预测,但脆弱,且无法应对现实数据的复杂性与多变性。经典机器学习结合人工设计的特征与统计学习。神经网络则相反,直接从原始数据中学习自身的表征,无需特征工程,能够处理远为复杂细腻的内容,但也更难解释、更依赖数据。神经网络相较以往方法的成功,正是当前 AI 生成革命的基础。
可以这样理解…
神经网络就像一个学音乐的学生,他不是通过研习乐理来学习,而是通过聆听成千上万部作品,在接触与反馈中逐渐形成对音乐结构、模式与风格的内在感受,进而运用它创作出反映自己所吸收一切的新音乐。
实用提示
当生成模型在某种特定类型的输出上屡屡受挫:不常见的文化美学、罕见的物体、特定的摄影风格:这往往是信号,表明这些元素在模型的训练数据中代表性不足。与其就同一元素写得更长、更强硬,不如尝试将这个代表性不足的元素与模型熟知的更常见参照点相结合(“传统日本能剧舞台,空间布局类似西方镜框式剧场”),帮助网络将这个陌生请求与其已学表征联系起来。
类型与变体
卷积神经网络(CNN)专为图像与空间数据设计,利用局部化的模式检测在多个尺度上识别特征。循环神经网络(RNN)通过在各时间步间保持某种记忆来处理序列数据。Transformer 使用注意力机制同时处理输入中所有元素之间的关系,使其成为语言模型的主导架构,并越来越多地用于图像与视频生成。生成对抗网络(GAN)使用两个相互竞争的网络(生成器与判别器)彼此对抗训练,以产出逼真的输出。扩散模型使用特定的正向与反向加噪过程来生成数据。变分自编码器(VAE)学习数据的压缩潜在表征。大多数现代大规模 AI 系统会在单一整体系统中组合多种架构类型。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
神经网络是创意制作中所用每一款 AI 生成工具的底层技术:图像合成、视频生成、自然语言生成、语音合成、音乐生成、代码生成、图像识别与分类、物体检测、翻译、摘要,以及现代机器学习几乎所有其他应用。把神经网络理解为所有这些系统的共同基础,有助于创作者理解为何相似的提示词原则常常可跨不同模态与工具适用:它们都是同一基本的已学模式识别架构的变体。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。