Apprentissage par transfert (Transfer Learning)
Qu’est-ce que Apprentissage par transfert (Transfer Learning) ?
Le transfer learning permet à un modèle d'IA d'appliquer ce qu'il a appris en résolvant un problème à la résolution d'un problème différent mais connexe : un peu comme l'étude d'une langue aide à en apprendre une similaire plus rapidement, parce qu'une grande partie des connaissances se transfère.
En un coup d’œil
- Aussi appelé
- Adaptation de domaineTransfert de connaissancesPré-entraînement et fine-tuning
- Utilisé pour
- Adapter de grands modèles d'IA pré-entraînés à des tâches spécifiques sans réentraînement completFine-tuning des modèles de génération d'images pour des styles, sujets ou domaines visuels spécifiquesConstruire des systèmes d'IA performants avec des données spécifiques à la tâche limitéesLa fondation sous-jacente à LoRA, DreamBooth et autres techniques d'adaptation
- Outils courants
- Hugging face (bibliothèque de modèles pré-entraînés et outils de fine-tuning)PyTorch et TensorFlow (frameworks de fine-tuning)ÉCosystème stable diffusion (workflows LoRA et fine-tuning)Morphic (modèles fine-tunés de personnages et de styles)
- Termes liés
- Fine-tuningLoRAFoundation modelTraining dataDiffusion modelDreamBooth
- How it works in simple terms
- Un grand modèle d'IA est entraîné sur un dataset général massif jusqu'à développer de larges capacités. Ce modèle pré-entraîné est ensuite adapté à une tâche spécifique à l'aide d'un dataset ciblé bien plus petit, ajustant les poids du modèle pour produire les sorties souhaitées pour la nouvelle application tout en conservant l'essentiel des connaissances issues de l'entraînement initial.
- Where you encounter this
- Le transfer learning se rencontre chaque fois qu'un modèle d'IA général est adapté à une fin spécifique : un assistant d'écriture construit sur un modèle de langage général, un modèle de génération d'images fine-tuné sur un style artistique spécifique, un modèle de cohérence de personnage entraîné sur l'apparence d'une personne précise ou un système de reconnaissance d'objets adapté à partir d'un modèle de vision général. Il sous-tend pratiquement tout déploiement pratique d'IA.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
Comparaison
Compared with related concepts
Le transfer learning et le fine-tuning sont des concepts apparentés mais distincts. Le transfer learning est l'approche large consistant à réutiliser les connaissances acquises sur une tâche pour en aborder une autre. Le fine-tuning est une technique spécifique de transfer learning dans laquelle les poids du modèle pré-entraîné sont mis à jour par un entraînement continu sur de nouvelles données spécifiques à la tâche. Tout fine-tuning est une application du transfer learning, mais le transfer learning peut aussi être appliqué sans fine-tuning : par exemple, par extraction de caractéristiques en utilisant un modèle pré-entraîné figé. Le fine-tuning est la technique de transfer learning la plus courante pour l'adaptation des modèles de génération par IA.
Imaginez plutôt…
Le transfer learning revient à recruter un musicien classiquement formé pour intégrer un ensemble de jazz : il comprend déjà l'harmonie, le rythme, la théorie et la technique instrumentale à un haut niveau, des connaissances qui se transfèrent directement. Il a besoin de relativement peu de formation supplémentaire pour appliquer ces fondations à l'idiome jazz, comparé à l'enseignement à quelqu'un qui n'a jamais joué de musique du tout. Le pré-entraînement est l'éducation au conservatoire ; le fine-tuning est l'apprentissage du jazz.
Astuce de pro
Lorsque vous commandez ou évaluez des modèles fine-tunés pour un usage en production : que ce soit pour la cohérence de personnage, le style artistique ou l'identité visuelle d'un produit, évaluez toujours la qualité du modèle de base à partir duquel le fine-tuning a été effectué, et non seulement celle du modèle fine-tuné. Un LoRA fine-tuné à partir d'un modèle de base de haute qualité surpassera généralement un LoRA issu d'un modèle de base de moindre qualité, même avec des données d'entraînement et une technique identiques. Le plafond de qualité du fine-tuning est largement déterminé par la capacité du modèle pré-entraîné sur lequel il s'appuie.
Types et variantes
- L'extraction de caractéristiques utilise un modèle pré-entraîné comme extracteur de caractéristiques fixe, en ajoutant uniquement une petite couche de sortie spécifique à la tâche, entraînée sur la nouvelle tâche pendant que les poids pré-entraînés restent figés.
- Le fine-tuning dégèle une partie ou la totalité des poids du modèle pré-entraîné et les met à jour sur la nouvelle tâche, permettant une adaptation plus profonde au prix de plus de calcul et de datasets plus importants.
- L'adaptation de domaine applique le transfer learning à des scénarios où les datasets source et cible diffèrent significativement dans leur distribution, en utilisant des techniques pour combler l'écart de domaine.
- Le few-shot transfer exploite les capacités pré-entraînées d'un modèle pour exécuter une nouvelle tâche à partir d'une poignée d'exemples seulement.
- LoRA et autres méthodes de fine-tuning à paramètres efficaces adaptent des sous-ensembles spécifiques de poids du modèle de manière efficace, permettant un transfert rapide et économe en ressources.
Prêt à créer votre première scène dans Morphic ?
Essayer MorphicCas d’usage courants
- Le transfer learning est utilisé chaque fois qu'une capacité d'IA doit être adaptée à un domaine ou une application spécifique sans entraîner un nouveau modèle depuis zéro.
- En génération d'images, il sous-tend le fine-tuning LoRA pour les styles artistiques, l'entraînement DreamBooth pour des sujets spécifiques et l'entraînement de modèles de cohérence de personnage.
- En traitement du langage naturel, il sous-tend le fine-tuning de grands modèles de langage pour des tâches spécifiques comme l'assistance au code, le service client ou les questions-réponses spécialisées par domaine.
- En vision par ordinateur, il permet la mise en place de systèmes de détection et de classification d'objets entraînés sur des domaines spécifiques en utilisant des fondations de modèles d'images généraux.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.