Glossaryarrow
転移学習
転移学習

転移学習とは、あるタスクまたはデータセットで訓練されたモデルを、新しいタスクでゼロから訓練するのではなく、異なるが関連するタスクを実行するために再利用し適応させる機械学習アプローチです。新しいモデルをランダムな重みで初期化し、ターゲット問題に対して完全に訓練する(典型的には膨大な量のデータ、計算リソース、時間を必要とするプロセス)のではなく、転移学習は事前訓練済みモデルに既にエンコードされている知識から始まり、新しい目的のためにそれを適応させます。事前訓練済みモデルは、元の訓練からデータ内の構造、パターン、関係を認識することを既に学習しており、これらの学習された表現は転移可能です。特定のターゲットアプリケーションが元の訓練目標と異なる場合でも、新しいタスクにとって価値があり続けます。

転移学習の背後にある基本的な洞察は、ある問題をうまく解決することを学習することが、多くの関連する問題にわたって有用な一般的能力を発展させるということです。何百万もの画像を分類するように訓練されたモデルは、まったく異なる画像タスク(画像の生成、物体の検出、画像品質の評価)にとって価値のあるエッジ、テクスチャ、形状、構図構造を認識することを学習します。テキストの膨大なコーパスで訓練されたモデルは、翻訳から要約、クリエイティブライティング、コーディングに至るタスクに転移する言語理解、推論能力、世界知識を発展させます。現代の最も強力なAIシステム(大規模言語モデル、基盤画像生成モデル、マルチモーダルAIシステム)はすべて、巨大なスケールで適用された転移学習の産物です。広範な一般データセットで訓練され、その後特定のアプリケーション向けにファインチューニング、命令チューニング、またはその他の技法を通じて適応されます。広範な事前訓練の後にターゲット化された適応を行うこのアーキテクチャは、現代のAI開発における支配的なパラダイムです。

AI生成ツールを扱う実務家にとって、転移学習は、特定のアプリケーション向けに生成モデルをカスタマイズするために使用される多くのファインチューニングおよび適応技法の基盤となるメカニズムです。LoRAファインチューニング、DreamBooth訓練、テクスチュアル・インバージョン、そして特定の視覚スタイルや被写体の一貫性のためのモデルファインチューニングはすべて転移学習の原則を適用しています。強力な事前訓練済み生成モデルから始めて、その出力を特定のターゲット(特定の芸術スタイル、特定のキャラクター、製品デザイン言語)に向けて適応させ、モデル全体を再訓練することはしません。転移学習を理解することは、これらの適応技法がなぜそれほど少ないデータと計算リソースを必要とするかを明確にします。モデルは既に高品質な画像生成に必要な基礎的能力を保有しています。ファインチューニングプロセスは、既存の能力を特定の出力ターゲットに向けることであり、能力をゼロから構築することではありません。

Can't find what you are looking for?
Contact us and let us know.
bg