Question 1

ゼロショットとフューショット学習の違いは何ですか？

Accepted Answer

ゼロショット学習は、推論時にタスク固有の例を提供せずにタスクを実行したりコンテンツを生成したりするモデルの能力で、完全に訓練からの一般化に頼ります。フューショット学習は、推論時にリクエストとともに少数の例（典型的には1から5の間）を提供し、望ましい出力がどう見えるかをモデルに示し、ゼロから一般化するのではなく提供された例に応答をパターンマッチングできるようにします。フューショットの性能は、訓練だけからは一般化が難しい特定のフォーマットやスタイルを持つタスクで、典型的にゼロショットより優れています。

Question 2

ゼロショット学習はAI生成の品質にどう影響しますか？

Accepted Answer

ゼロショット学習は、AI生成モデルを柔軟で広く適用可能にする根底にある能力です。すなわち、生成モデルが、直接生み出すよう訓練されたことのない概念や組み合わせのプロンプトに意味のある形で応答することを可能にするものです。ゼロショットの性能の質が、モデルが有用な結果を生み出しつつ馴染みのある領域からどれだけ遠くへ押し進められるかを決めます。ゼロショットの一般化が破綻するところ（非常に新しい、矛盾する、または不十分に指定されたプロンプト）では、出力品質は、要求された新規性へ成功裏に外挿するのではなく、モデルが訓練分布全体で平均化することを反映する一般的または整合性のない結果へと劣化します。

Question 3

より良いプロンプトでゼロショットの性能を改善できますか？

Accepted Answer

はい。プロンプトの特異性と文脈的アンカーの提供は、モデルが新しいリクエストにどれだけうまく一般化するかに大きく影響します。珍しい概念の組み合わせをその馴染みのある構成要素に分解すること、最も新しい側面に視覚的またはテキストの参照例を提供すること、そしてモデルの訓練が遭遇した可能性の高い言葉で望ましい出力のキャラクターを明示的に記述することは、すべてモデルのゼロショット能力の端にあるタスクの結果を改善します。目標は、モデルが少なすぎるガイダンスから盲目的に外挿するのではなく、新しいターゲットへと補間できるよう、十分な馴染みのある参照ポイントを提供することです。

Question 4

モデルがゼロショットのタスクで失敗する原因は何ですか？

Accepted Answer

ゼロショットの失敗は、要求された概念、スタイル、またはタスクの組み合わせがモデルの訓練の効果的な一般化の届く範囲外に収まるときに起こります。すなわち、モデルが要求された新規性へ正確に外挿するための関連パターンが訓練データに十分ないときです。これは、概念が訓練データで本当に稀であるため、概念の組み合わせがモデルが解決できない矛盾するシグナルを作り出すため、またはタスクがモデルのアーキテクチャがサポートしない程度の新しい推論を必要とするために起こり得ます。ゼロショットが失敗すると、典型的な結果は、一般的で、混乱した、またはリクエストの具体的な意図された意味ではなく表面レベルの言葉の最も一般的な関連にデフォルト設定される出力です。

Question 5

ゼロショット学習はプロンプトエンジニアリングとどう関係しますか？

Accepted Answer

プロンプトエンジニアリングは、ゼロショットとフューショットの能力の制約の中で有用なモデルの性能を最大化する実用的な分野として理解できます。プロンプトエンジニアは、モデルの一般化の能力と協働します。すなわち、モデルが成功裏に一般化できる言葉でリクエストをフレーミングしようとし、ゼロショット単独では不十分なときに例を提供し、曖昧さを減らしモデルの推論を意図された出力へと導くようにプロンプトを構成します。ゼロショット学習を理論的に理解することは、特定のプロンプト戦略がなぜ機能し他がなぜ失敗するかを説明することで、より良いプロンプトエンジニアリングの実践を支えます。

Question 6

ゼロショット学習は大規模AIモデルに固有ですか？

Accepted Answer

ゼロショット能力はモデルのサイズと訓練データの多様性とともに強くスケールします。すなわち、より多様なデータで訓練されたより大きなモデルは一般的により良いゼロショットの一般化を示します。より小さなまたはより特化したモデルは、その特定の訓練ドメインの外でしばしばゼロショットの性能が乏しく、新しい入力でうまく機能するためにタスク固有の例やファインチューニングを必要とします。非常に大きな事前訓練済みモデル（GPT規模の言語モデル、画像生成のための大規模拡散モデル）の開発は、より小さなモデルが近づけない実用的なレベルにゼロショット能力をもたらしました。これが、大規模な基盤モデルが生成AIアプリケーションで支配的なアプローチになった理由の一つです。

Question 7

ゼロショット学習はAI動画生成に特にどう適用されますか？

Accepted Answer

AI動画生成では、ゼロショット能力が、ラベル付き訓練例として直接表現されていなかった被写体、スタイル、カメラ動作、雰囲気的条件のプロンプト記述をモデルがどれだけうまく解釈できるかを決めます。強いゼロショット動画生成能力を持つモデルは、珍しい概念の組み合わせ、技術用語で記述された特定のカメラ技法、または名付けられた視覚参照ではなく記述的な言語で指定された雰囲気的品質に対して妥当な映像を生み出せます。ゼロショット動画生成の能力が超過されるところでは、モデルは具体的に要求された出力ではなく、一般的なカメラ動作、平均化された視覚スタイル、そして一般的な訓練例を近似する被写体表現にデフォルト設定する傾向があります。

Question 8

ゼロショット能力に頼るべきですか、それとも常に参照画像を提供すべきですか？

Accepted Answer

最適なアプローチは、要求された出力がどれだけ新しいか特定的かに依存します。モデルの訓練データによく表現された概念やスタイル（名付けられた視覚スタイル、確立された撮影技法、明確に記述された被写体）には、ゼロショット生成が典型的に良い結果を生み、参照画像はわずかな改善を加えます。モデルの訓練分布に押し迫る非常に特定的、珍しい、または新しい概念には、参照画像が、モデルの推論を一般的な平均ではなく意図されたターゲットへと導く価値あるアンカーです。実際には、生成の最も特定的で新しい要素には参照画像を提供しつつ、より馴染みのある要素にはゼロショット能力に頼ることが、最も効率的なアプローチです。

ゼロショット学習

ゼロショット学習とは？

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

種類とバリエーション

Morphicで最初のシーンを作ってみませんか？

主な活用シーン

シーンを演出し、キャラクターをデザインし、長編映像まで仕上げる

FAQ