Inference(推理)是已训练模型根据输入(如提示、图像)生成输出的过程,与训练相对。推理速度与质量是用户体验与成本的关键。
在 AI 生成平台中,每次生成即一次推理;优化推理是提升响应与降低成本的核心。