Apprentissage zero-shot
Qu’est-ce que Apprentissage zero-shot ?
L'apprentissage zero-shot est la capacité d'un modèle à gérer des tâches ou des contenus pour lesquels il n'a jamais été spécifiquement entraîné, en appliquant des connaissances générales issues de son entraînement plus large à des situations nouvelles qu'il n'a jamais directement vues.
En un coup d’œil
- Aussi appelé
- Généralisation zero-shotInférence zero-shotCapacité zero-shot
- Utilisé pour
- Exécuter des tâches inédites sans exemples d'entraînement spécifiques à la tâcheGénérer du contenu pour des combinaisons de concepts absentes des données d'entraînementTester l'étendue de la capacité de généralisation d'un modèleComprendre pourquoi les modèles IA réussissent ou échouent sur des prompts inhabituels
- Key features
- Exécute des tâches sans exemples d'entraînement directs pour ces tâchesGénéralise à partir des connaissances plus larges de l'entraînement vers des scénarios inéditsSe distingue de l'apprentissage few-shot et du fine-tuningà la fois une capacité pratique et une mesure de la qualité d'un modèle
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
Comparaison
l'apprentissage zero-shot se compare le plus utilement à l'apprentissage few-shot et au fine-tuning comme points sur un spectre d'adaptation du modèle. La performance zero-shot est ce que le modèle peut faire sans aucun guidage spécifique à la tâche. La performance few-shot est ce que le modèle peut faire lorsqu'on lui fournit un petit nombre d'exemples dans le prompt, ce qui pour les grands modèles de langage et de génération actuels est souvent nettement meilleur que le zero-shot pour des tâches précises. Le fine-tuning est ce que le modèle peut faire après que ses poids ont été mis à jour sur un jeu de données précis, représentant l'adaptation maximale possible à une tâche ou un domaine précis, au prix de l'investissement d'entraînement. Pour le travail de génération pratique, la plupart des tâches se situent entre le zero-shot pur et la zone few-shot, où fournir des exemples de référence visuels ou textuels aux côtés d'un prompt améliore significativement la qualité des sorties.
Imaginez plutôt…
L'apprentissage zero-shot est analogue à demander à quelqu'un qui n'est jamais allé au Japon mais a lu abondamment à son sujet, regardé de nombreux films japonais et étudié la langue de décrire l'intérieur d'un ryokan traditionnel. Cette personne n'a jamais directement fait l'expérience du sujet, mais peut produire une description plausible et souvent juste en généralisant à partir des connaissances apparentées étendues que sa large exposition a bâties. La qualité de sa généralisation dépend de la richesse et de l'interconnexion de ses connaissances d'arrière-plan : quelqu'un avec une exposition culturelle japonaise profonde et variée généralisera plus précisément que quelqu'un n'ayant qu'une connaissance superficielle de quelques aspects. Les modèles IA fonctionnent de la même manière : l'ampleur et la profondeur de leur entraînement déterminent la qualité de leur généralisation zero-shot vers des demandes inédites.
Astuce de pro
Lorsqu'un modèle de génération produit des résultats décevants pour un prompt inhabituel ou très spécifique, le problème est souvent que la demande se situe hors de la portée effective de généralisation zero-shot du modèle : la combinaison de concepts est trop inédite ou trop spécifique pour que le modèle l'interpole précisément depuis son entraînement. La réponse pratique consiste à décomposer le prompt : plutôt que de demander toute la combinaison inhabituelle d'un coup, fragmentez-la en ses éléments familiers composants et décrivez-les séparément. Ajoutez des images de référence visuelles pour les éléments les plus inédits. Si la direction stylistique est très spécifique, fournissez une image d'exemple qui s'en rapproche. Chaque point d'ancrage supplémentaire que vous fournissez déplace la demande d'une généralisation zero-shot pure vers une inférence plus guidée, qui produit généralement des résultats nettement meilleurs.
Types et variantes
- L'apprentissage zero-shot englobe plusieurs capacités distinctes selon les modalités IA.
- En génération de langage et de texte, la capacité zero-shot permet aux modèles de suivre des instructions pour des types de tâches sur lesquels ils n'ont pas été spécifiquement entraînés, de classer du texte dans des catégories inédites et de répondre à des questions sur des sujets non directement présents dans les données d'entraînement.
- En génération d'images, la capacité zero-shot permet aux modèles de générer une imagerie plausible pour des combinaisons de concepts, des styles visuels et des descriptions de sujets non directement représentés comme exemples d'entraînement.
- En génération vidéo, la généralisation zero-shot s'étend à des combinaisons inédites de mouvements de caméra, de sujets et de conditions atmosphériques qui produisent des résultats cohérents par extrapolation depuis du matériel d'entraînement apparenté.
- L'apprentissage few-shot est la capacité adjacente où un petit nombre d'exemples fournis dans le prompt au moment de l'inférence guide le comportement du modèle, atteignant un meilleur alignement à la tâche que le zero-shot seul, sans le coût d'un fine-tuning.
Prêt à créer votre première scène dans Morphic ?
Essayer MorphicCas d’usage courants
- L'apprentissage zero-shot est pertinent dans toute interaction avec un modèle d'IA générative où la tâche ou le contenu demandé est inédit, inhabituel ou très spécifique.
- Demander à un modèle de génération d'images un style visuel qui ne correspond pas à un artiste ou un mouvement nommé repose sur la généralisation zero-shot pour traduire la description en une sortie esthétique cohérente.
- Demander à un modèle de langage d'expliquer un concept dans un format inhabituel ou depuis une perspective inattendue repose sur la généralisation zero-shot des tâches.
- Générer une vidéo de combinaisons de sujets très spécifiques et inhabituelles (créatures, environnements, actions et styles combinés d'une manière sans analogue direct dans l'entraînement) repose sur la généralisation zero-shot pour produire des résultats cohérents.
- Comprendre quand une demande relève de la capacité zero-shot d'un modèle et quand elle nécessite plus de guidage ou de décomposition est une compétence pratique pour une production IA efficace.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.