风格迁移(Style Transfer)
风格迁移(Style Transfer)是什么?
风格迁移是一种技法:AI 取一张图像的视觉外观(它的色彩、纹理与艺术风格),施加到一张内容完全不同的图像上,使结果看起来就像第二张图像以第一张的风格被画出或拍出。
一图看懂
- 别称
- 神经风格迁移艺术风格迁移风格条件
- 主要用途
- 把艺术风格施加到照片与视频上在生成内容间维持视觉一致性把写实素材转译为风格化的视觉语言对美学处理进行创意探索
- How it works in simple terms
- 一个神经网络把图像的内容与其风格分离开,再生成一张新图像,把一个来源的内容与另一个来源的视觉处理结合起来。
- Where you encounter this
- AI 图像与视频生成平台带艺术滤镜功能的照片编辑应用后期制作的调色与外观开发视觉特效合成流水线
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
对比与差异
Compared with related concepts
风格迁移与调色都会修改内容的视觉外观,但二者运作在根本不同的层面。调色通过对图像色彩信息施加变换来调整素材的影调与色彩属性,而不改变其内容结构、纹理或构图处理。风格迁移不仅改变色彩,还改变纹理、边缘处理、表面质感与整体视觉渲染思路,施加的是参考美学的深层结构特征,而不仅仅是调整既有的色彩值。调色是对图像既有视觉属性的调整;风格迁移则用另一种视觉语言的属性替换掉这些属性。
可以这样理解…
风格迁移就像有一位能同时看着两样东西的临摹高手:一张特定场景的照片,和一位特定艺术家的画作,然后把这个场景重现为仿佛由那位艺术家所画。场景的内容被忠实保留,但关于它如何呈现的一切,,颜料的纹理、光线的处理方式、那种特征性的笔触,,都出自艺术家之手,而非相机的镜头。
实用提示
在 AI 生成工作流中施加风格迁移时,要明确你希望风格参考影响哪些视觉维度。一张高度风格化的参考图会同时对色彩、纹理、对比与渲染思路施加条件,如果生成的内容与参考的题材相去甚远,可能产出被压倒性变换的输出。为获得更受控的结果,可在风格参考之外辅以文字提示,描述你想施加的风格维度,并明确排除那些属于参考图像瑕疵、而非有意目标的风格特质:例如,注明你想要某张参考的配色方案,但不要它的构图思路。
类型与变体
风格迁移是一个在精密度、可控性与应用语境上各异的技法谱系。经典神经风格迁移通过对单张图像的迭代优化产出结果,速度慢,但产出非常字面的风格施加。快速风格迁移训练一个前馈网络,以单次前向传播近似该变换,实现实时应用。基于扩散的风格条件通过现代图像生成模型的去噪过程施加风格,使风格与内容的混合比经典方法更灵活。视频风格迁移在各帧间沿时间施加风格变换,需要额外的时间一致性约束以防闪烁。基于 LoRA 的风格迁移通过训练把某种特定风格编码进模型权重,在推理时无需参考图像即可产出强而一致的风格条件。
准备好在 Morphic 里做第一个场景了吗?
试用 Morphic常见使用场景
风格迁移在创意制作中被用来出于特定美学目的,把摄影或写实素材转化为风格化的视觉语言:把外景素材转为动画影片美学、把复古胶片外观施加到当代素材上,或把产品摄影渲染为插画或绘画风格。音乐录影带制作用风格迁移来创造独特的视觉处理以使内容差异化。广告借助它把生成或拍摄的内容调整为与品牌既定视觉身份相符。游戏开发用风格迁移在通过不同工具或由不同艺术家产出的素材间维持一致的美术方向。社媒内容创作则借助该技术的面向消费者的应用来实现艺术滤镜与美学变换。
准备好开始创作了吗?
执导场景、设计角色、完成整部影片
一站式 AI 创作平台,定价简单透明,无速度节流,搭配无限 Canvas,让创作发挥到极致。
常见问题(FAQ)
最初的神经风格迁移方法使用一个预训练的卷积神经网络(通常是 VGG-19),从内容图像和风格图像中分别提取特征表示。内容表示从网络较深的层捕捉高层语义信息,代表图像的主体及其空间关系。风格表示捕捉跨多层的特征激活之间的统计关系,代表纹理、色彩图案与表面品质。随后通过梯度下降对一张输出图像进行优化,使其同时匹配内容图像的内容表示与风格图像的风格表示。
滤镜对图像的像素值施加一个预先设定的数学变换:对亮度、对比、色彩平衡或颗粒的固定调整。无论图像内容如何,它都施加同样的变换,产出一致、可预测的结果。风格迁移则提取并施加某张参考图像的特定视觉特征,以固定滤镜无法做到的方式,使变换适应目标图像的内容。风格迁移在保留语义内容的同时施加一种参考美学;而滤镜只是调整既有视觉属性,并不参照某个特定的美学来源。
可以,不过视频风格迁移带来了一个额外挑战:时间一致性,即确保风格在各帧间被一致地施加,从而使输出不会在略有差异的风格诠释之间闪烁。视频风格迁移系统使用光流与时间一致性约束,在各帧间流畅地传播风格信息。基于扩散的视频生成模型把时间一致性作为其核心架构的一部分来处理,这使它们比把基于图像的风格迁移逐帧施加到既有素材上更适合做风格条件的视频生成。
传统风格迁移在推理时通过一个优化过程或一个训练好的前馈网络,把内容表示与风格表示结合,计算出一张新图像。LoRA 则在一组风格一致的训练图像上微调生成模型的权重,把风格编码进模型本身。基于 LoRA 的风格条件从一开始就作为生成过程的一部分运作,而不是作为一次后处理变换,所产出的输出中风格更自然地融入生成内容之中。LoRA 产生的风格遵循度也比单靠参考图像条件更强、更一致。
强烈的风格迁移可能与角色身份的保留相冲突,因为在施加目标美学的过程中,风格变换可能改变面部特征、比例及其他对身份至关重要的细节。带人脸身份条件的 IP-Adapter 以及 InstantID 等技术,专门设计用于在对周围渲染施加风格变化的同时保留面部身份。对于既需要风格一致又需要角色身份的应用(例如系列作品中风格化的角色插画),把角色身份参考与风格参考结合,比单靠风格迁移产出更好的结果。
风格迁移与图生图生成相关,但并不相同。图生图生成以一张既有图像作为结构输入,并在该结构与一条文字或参考提示的条件下生成一张新图像;这种变换可以包含风格变化,但也可以包含内容修改、内补(inpainting)与结构变体。风格迁移则专门针对图像的美学表层处理,同时保留其内容结构。在当代基于扩散的工作流中,风格迁移常被实现为带风格参考的图生图生成的一种具体应用,但图生图所涵盖的变换范围比风格迁移本身更广。
当前的风格迁移技术在处理那些需要对内容做深层结构改变、而非表层美学处理的风格时表现吃力。训练数据中代表性不足的、非常具体且高度个性化的风格,可能无法仅靠参考条件被准确捕捉。视频中的时间一致性仍是挑战,对风格上较为激进的变换尤其如此。而且,风格与内容的分离本身就不完美,这意味着风格参考往往不仅对生成的美学表层,也会对其内容与构图施加条件。
在 Morphic 中,风格迁移原则主要通过上传到项目 Assets 标签、并在生成会话中用作条件输入的风格参考图像来应用。视频转视频(video-to-video)生成工作流还允许既有素材作为结构输入,同时由风格参考引导新生成的视觉处理。这种结构输入与风格条件的结合,使创作者能在保留素材运动与构图的同时变换其美学,这对于统一不同时间或不同源素材生成的片段的视觉语言尤其有用。