迁移学习(Transfer Learning)是一种机器学习方法:把在某一任务或数据集上训练得到的模型,重新调整并改用于一个不同但相关的任务,而不是为该新任务从零训练一个全新模型。它不会“以随机权重初始化模型,然后完全在目标任务上训练”——后者通常需要大量的数据、计算资源与时间。迁移学习从“预训练模型已经编码下来的知识”出发,把它适配到新的用途之上。预训练模型在最初的训练目标中,已经学到了如何识别数据中的结构、模式与关系;这些学到的表征是可迁移的——即便目标应用与原始训练目标不同,它们对新任务依然有价值。
迁移学习背后的根本洞见是:“把一个问题学好”所发展出的能力,在许多相关问题上都是普遍可用的。一个学会对数百万张图像进行分类的模型,会学到识别边缘、纹理、形状与构图结构——这些能力对完全不同的图像任务(生成图像、检测物体、评估图像质量)依然有价值。一个在大规模文本语料上训练的模型,会发展出语言理解、推理能力与世界知识,这些能力可迁移到从翻译、摘要到创作、编程的各种任务之上。当代最强大的 AI 系统——大语言模型、图像生成基础模型、多模态 AI 系统——本质上都是“迁移学习在极大规模下应用”的产物:先在广泛、通用的数据上进行预训练,再通过微调、指令调优或其他技术,针对具体应用进行调整。“广泛预训练 + 针对性适配”这一架构,是当代 AI 发展中占据主导地位的范式。
对使用 AI 生成工具的从业者而言,迁移学习是众多“为特定应用定制生成模型”的微调与适配技术背后的基本机制。LoRA 微调、DreamBooth 训练、文本反演,以及面向特定视觉风格或主体一致性的模型微调,本质上都在运用迁移学习的原理:它们从一个已具备强大生成能力的预训练模型出发,把其输出朝某一具体目标——某种艺术风格、某个具体角色、某套产品设计语言——做有针对性的调整,而无需重训整个模型。理解迁移学习,可以解释清楚为什么这些适配技术所需的数据量与算力会如此之少:模型本身已经具备高质量图像生成所需的基础能力,微调过程做的是“把已有能力导向某一具体输出目标”,而不是从零搭建能力。