Apprentissage par transfert (Transfer Learning)

Qu’est-ce que Apprentissage par transfert (Transfer Learning) ?

Le transfer learning permet à un modèle d'IA d'appliquer ce qu'il a appris en résolvant un problème à la résolution d'un problème différent mais connexe : un peu comme l'étude d'une langue aide à en apprendre une similaire plus rapidement, parce qu'une grande partie des connaissances se transfère.

En un coup d’œil

Aussi appelé
Adaptation de domaineTransfert de connaissancesPré-entraînement et fine-tuning
Utilisé pour
Adapter de grands modèles d'IA pré-entraînés à des tâches spécifiques sans réentraînement completFine-tuning des modèles de génération d'images pour des styles, sujets ou domaines visuels spécifiquesConstruire des systèmes d'IA performants avec des données spécifiques à la tâche limitéesLa fondation sous-jacente à LoRA, DreamBooth et autres techniques d'adaptation
Outils courants
Hugging face (bibliothèque de modèles pré-entraînés et outils de fine-tuning)PyTorch et TensorFlow (frameworks de fine-tuning)ÉCosystème stable diffusion (workflows LoRA et fine-tuning)Morphic (modèles fine-tunés de personnages et de styles)
Termes liés
Fine-tuningLoRAFoundation modelTraining dataDiffusion modelDreamBooth
How it works in simple terms
Un grand modèle d'IA est entraîné sur un dataset général massif jusqu'à développer de larges capacités. Ce modèle pré-entraîné est ensuite adapté à une tâche spécifique à l'aide d'un dataset ciblé bien plus petit, ajustant les poids du modèle pour produire les sorties souhaitées pour la nouvelle application tout en conservant l'essentiel des connaissances issues de l'entraînement initial.
Where you encounter this
Le transfer learning se rencontre chaque fois qu'un modèle d'IA général est adapté à une fin spécifique : un assistant d'écriture construit sur un modèle de langage général, un modèle de génération d'images fine-tuné sur un style artistique spécifique, un modèle de cohérence de personnage entraîné sur l'apparence d'une personne précise ou un système de reconnaissance d'objets adapté à partir d'un modèle de vision général. Il sous-tend pratiquement tout déploiement pratique d'IA.

Prêt à créer ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.

Comparaison

Comparaison

Compared with related concepts

Le transfer learning et le fine-tuning sont des concepts apparentés mais distincts. Le transfer learning est l'approche large consistant à réutiliser les connaissances acquises sur une tâche pour en aborder une autre. Le fine-tuning est une technique spécifique de transfer learning dans laquelle les poids du modèle pré-entraîné sont mis à jour par un entraînement continu sur de nouvelles données spécifiques à la tâche. Tout fine-tuning est une application du transfer learning, mais le transfer learning peut aussi être appliqué sans fine-tuning : par exemple, par extraction de caractéristiques en utilisant un modèle pré-entraîné figé. Le fine-tuning est la technique de transfer learning la plus courante pour l'adaptation des modèles de génération par IA.


Imaginez plutôt…

Le transfer learning revient à recruter un musicien classiquement formé pour intégrer un ensemble de jazz : il comprend déjà l'harmonie, le rythme, la théorie et la technique instrumentale à un haut niveau, des connaissances qui se transfèrent directement. Il a besoin de relativement peu de formation supplémentaire pour appliquer ces fondations à l'idiome jazz, comparé à l'enseignement à quelqu'un qui n'a jamais joué de musique du tout. Le pré-entraînement est l'éducation au conservatoire ; le fine-tuning est l'apprentissage du jazz.


Astuce de pro

Lorsque vous commandez ou évaluez des modèles fine-tunés pour un usage en production : que ce soit pour la cohérence de personnage, le style artistique ou l'identité visuelle d'un produit, évaluez toujours la qualité du modèle de base à partir duquel le fine-tuning a été effectué, et non seulement celle du modèle fine-tuné. Un LoRA fine-tuné à partir d'un modèle de base de haute qualité surpassera généralement un LoRA issu d'un modèle de base de moindre qualité, même avec des données d'entraînement et une technique identiques. Le plafond de qualité du fine-tuning est largement déterminé par la capacité du modèle pré-entraîné sur lequel il s'appuie.

Types et variantes

  • L'extraction de caractéristiques utilise un modèle pré-entraîné comme extracteur de caractéristiques fixe, en ajoutant uniquement une petite couche de sortie spécifique à la tâche, entraînée sur la nouvelle tâche pendant que les poids pré-entraînés restent figés.
  • Le fine-tuning dégèle une partie ou la totalité des poids du modèle pré-entraîné et les met à jour sur la nouvelle tâche, permettant une adaptation plus profonde au prix de plus de calcul et de datasets plus importants.
  • L'adaptation de domaine applique le transfer learning à des scénarios où les datasets source et cible diffèrent significativement dans leur distribution, en utilisant des techniques pour combler l'écart de domaine.
  • Le few-shot transfer exploite les capacités pré-entraînées d'un modèle pour exécuter une nouvelle tâche à partir d'une poignée d'exemples seulement.
  • LoRA et autres méthodes de fine-tuning à paramètres efficaces adaptent des sous-ensembles spécifiques de poids du modèle de manière efficace, permettant un transfert rapide et économe en ressources.

Prêt à créer votre première scène dans Morphic ?

Essayer Morphic

Cas d’usage courants

  • Le transfer learning est utilisé chaque fois qu'une capacité d'IA doit être adaptée à un domaine ou une application spécifique sans entraîner un nouveau modèle depuis zéro.
  • En génération d'images, il sous-tend le fine-tuning LoRA pour les styles artistiques, l'entraînement DreamBooth pour des sujets spécifiques et l'entraînement de modèles de cohérence de personnage.
  • En traitement du langage naturel, il sous-tend le fine-tuning de grands modèles de langage pour des tâches spécifiques comme l'assistance au code, le service client ou les questions-réponses spécialisées par domaine.
  • En vision par ordinateur, il permet la mise en place de systèmes de détection et de classification d'objets entraînés sur des domaines spécifiques en utilisant des fondations de modèles d'images généraux.

Prêt à créer ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.

FAQ

Qu'est-ce que le transfer learning en IA ?

Le transfer learning est une approche d'apprentissage automatique dans laquelle un modèle entraîné sur une tâche ou un dataset est adapté pour effectuer une tâche différente mais connexe, plutôt que d'être entraîné depuis zéro. Les représentations apprises par le modèle pré-entraîné : sa compréhension des schémas, structures et relations dans les données, sont réutilisées pour la nouvelle application, réduisant considérablement les données, le temps et les ressources de calcul nécessaires pour atteindre de bonnes performances.

Pourquoi le transfer learning est-il si largement utilisé en IA ?

Le transfer learning est largement utilisé parce qu'entraîner de grands modèles d'IA depuis zéro exige d'énormes quantités de données, de ressources de calcul et de temps qui sont inaccessibles à la plupart des praticiens et des organisations. Le transfer learning démocratise l'accès à des capacités d'IA puissantes en permettant aux praticiens de partir d'une solide fondation pré-entraînée et de l'adapter à des besoins spécifiques avec bien moins de ressources. L'approche produit aussi généralement de meilleurs résultats que l'entraînement depuis zéro avec des données spécifiques à la tâche limitées.

Quelle est la relation entre transfer learning et fine-tuning ?

Le fine-tuning est la technique la plus courante pour appliquer le transfer learning en pratique. Il consiste à prendre un modèle pré-entraîné et à poursuivre son entraînement sur un nouveau dataset spécifique à la tâche, en mettant à jour les poids du modèle pour adapter ses sorties à la nouvelle application tout en conservant l'essentiel des connaissances encodées durant l'entraînement initial. Tout fine-tuning est une application du transfer learning ; le transfer learning peut aussi être appliqué par d'autres méthodes, comme l'extraction de caractéristiques.

Comment le transfer learning s'applique-t-il aux modèles de génération d'images ?

En génération d'images, le transfer learning sous-tend les techniques d'adaptation utilisées pour personnaliser les modèles de génération vers des sorties spécifiques. Le fine-tuning LoRA adapte un modèle de génération général à un style artistique, un domaine visuel ou un sujet spécifique. L'entraînement DreamBooth encode l'apparence d'un sujet spécifique ( une personne, un produit, un lieu ) dans le modèle. Ces techniques appliquent toutes les principes du transfer learning, partant d'une puissante fondation de génération pré-entraînée et orientant ses capacités vers une cible créative spécifique.

Qu'est-ce qu'un foundation model et comment se rattache-t-il au transfer learning ?

Un foundation model est un grand modèle d'IA entraîné à grande échelle sur des datasets larges et généraux, destiné à servir de point de départ pour l'adaptation à de nombreuses tâches spécifiques via le transfer learning. Les foundation models : grands modèles de langage comme GPT et Claude, modèles de génération d'images comme Stable Diffusion et Flux, investissent des ressources énormes dans un entraînement général étendu précisément pour que des applications spécifiques puissent être construites à partir d'eux de manière efficace par transfer learning plutôt que par un entraînement complet individuel.

Combien de données faut-il pour un fine-tuning par transfer learning ?

La quantité de données nécessaire pour un fine-tuning par transfer learning est considérablement inférieure à celle requise pour un entraînement depuis zéro, et varie selon la similitude entre les tâches source et cible. Un fine-tuning LoRA pour un style artistique spécifique peut être efficace avec aussi peu que vingt à cinquante images de référence de haute qualité. L'entraînement DreamBooth d'un sujet peut être efficace avec moins de vingt images d'un sujet spécifique. Plus la tâche cible est proche de la distribution de pré-entraînement initial, moins il faut généralement de données pour obtenir une bonne adaptation.

Qu'est-ce que l'adaptation de domaine dans le contexte du transfer learning ?

L'adaptation de domaine est un défi de transfer learning qui survient lorsque la distribution des données de la tâche cible diffère significativement de celle des données d'entraînement source. Par exemple, un modèle entraîné sur des photographies de portraits en studio peut ne pas se transférer parfaitement à la portraiture environnementale en extérieur, car la distribution visuelle des deux domaines diffère : en éclairage, en couleur, en profondeur de champ et en conventions compositionnelles. Les techniques d'adaptation de domaine tentent de combler cet écart, en ajustant les représentations apprises du modèle pour qu'il fonctionne bien dans le domaine cible malgré la différence de distribution.

Qu'est-ce que LoRA et comment utilise-t-il le transfer learning ?

LoRA (Low-Rank Adaptation) est une technique de fine-tuning à paramètres efficaces qui adapte un modèle pré-entraîné en entraînant un petit ensemble de matrices de poids additionnelles tout en laissant les poids du modèle original figés. Les poids LoRA sont bien plus petits que le modèle complet, ce qui les rend rapides à entraîner et faciles à partager et à combiner. En génération d'images, LoRA applique le transfer learning pour orienter un modèle de génération général vers un style, un sujet ou un domaine visuel spécifique sans modifier ni réentraîner le modèle de base complet.

Can't find what you are looking for?
Contact us and let us know.
bg