ゼロショット学習
ゼロショット学習とは、AIモデルが、例として明示的に学習したことのない概念を含むタスクを実行したりコンテンツを生成したりする能力を指す。より広い学習から推論とパターン転移によって新しいシナリオに対処し、直接の記憶に頼らずに一般化する。ゼロショット能力を持つモデルは、ラベル付き学習例として一度も見たことのない概念・スタイル・シナリオを記述したプロンプトに、関連する知識を使って妥当な結果を生む形で意味ある応答ができる。
この概念は、少数の例で応答を導くファイトショット学習や、タスク固有データでモデルの重みを調整するファインチューニングと対比される。ゼロショット性能は、モデルの一般的な推論と一般化能力、追加学習なしに新しい状況に学習した知識を柔軟に適用する能力の指標である。画像・動画生成では、ゼロショット能力とは、モデルが学習データに離散的な例として含まれていなかった新しいプロンプト記述、概念の珍しい組み合わせ、特定の指示に基づいて、学習した関連する視覚・テキストパターンから一般化することで、コンテンツを解釈・生成できることを意味する。
ゼロショット学習を理解すると、現代のAI生成モデルの印象的な柔軟性と、その特徴的な失敗モードの両方が説明できる。モデルが珍しいプロンプトをうまく扱うときは、学習から効果的に一般化している。非常に新奇または矛盾する入力で混乱した・一貫しない結果を出すときは、一般化で学習が支える境界を超えている。この理解は、珍しいプロンプトでモデルを押すべきときと、複雑な新奇な要求をより馴染みのある構成ステップに分解すべきときの判断に役立つ。