Transformer 是基于自注意力机制的神经网络架构,是当前大语言模型与多模态模型(如 CLIP、部分扩散模型)的基础。
理解 Transformer 有助于理解提示如何被「理解」以及多模态生成的架构。