Données d'entraînement (Training Data)
Qu’est-ce que Données d'entraînement (Training Data) ?
Les données d'entraînement sont l'ensemble des images, vidéos et textes dont un modèle d'IA a appris : c'est la source de tout ce que le modèle sait sur l'apparence des choses et la manière dont le langage se relie aux visuels.
En un coup d’œil
- Aussi appelé
- Dataset d'entraînementCorpus d'entraînementEnsemble d'entraînementDonnées de pré-entraînement
- Utilisé pour
- Apprendre aux modèles d'IA à associer le contenu visuel aux descriptions linguistiquesÉTablir la gamme de styles, de sujets et de concepts visuels qu'un modèle peut générerDiagnostiquer pourquoi les modèles obtiennent de bons résultats sur certains types de contenu et de mauvais sur d'autresOrienter les décisions de fine-tuning en identifiant les lacunes de couverture d'entraînement d'un modèle de base
- Key features
- Détermine directement ce que le modèle sait, peut générer et quels biais il porteLes paires image-texte enseignent les associations langue-visuel pour les modèles génératifsLa qualité, la diversité et la couverture du dataset déterminent la qualité et la gamme de générationLa sous-représentation d'un sujet dans les données d'entraînement produit une génération incohérente
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.
Comparaison
Compared with related concepts
Les données d'entraînement sont distinctes des données de fine-tuning, des entrées d'inférence et des paramètres du modèle, bien que tous soient liés au fonctionnement du modèle. Les données d'entraînement constituent le dataset massif utilisé pour entraîner le modèle depuis zéro : des milliards d'exemples qui établissent sa connaissance fondamentale. Les données de fine-tuning forment un dataset bien plus petit et ciblé, utilisé pour adapter un modèle déjà entraîné à des tâches ou styles spécifiques. Les entrées d'inférence sont les prompts et références soumis au modèle au moment de la génération : ce que vous fournissez lors de l'utilisation du modèle. Les paramètres du modèle sont les poids numériques appris au sein du réseau de neurones qui encodent toute la connaissance dérivée des données d'entraînement. Les données d'entraînement façonnent les paramètres ; les paramètres déterminent comment les entrées d'inférence sont interprétées ; les données de fine-tuning ajustent les paramètres de manière incrémentale. Comprendre ces distinctions aide les créateurs à utiliser les bons outils ( prompting, fine-tuning ou sélection de modèle ) pour différents types de défis de génération.
Imaginez plutôt…
Les données d'entraînement sont à un modèle d'IA ce que chaque livre, film, photographie et œuvre d'art qu'un artiste humain a un jour rencontré est à sa sensibilité créative. Un artiste élevé dans une tradition culturelle, un langage visuel et une histoire esthétique spécifiques reflétera ces influences dans tout ce qu'il crée : son œil a été formé par l'exposition. Demandez-lui de travailler en dehors de cette tradition et il pourra essayer, mais les lacunes dans son expérience visuelle se manifesteront par des incohérences et une main esthétique moins assurée. Les données d'entraînement d'un modèle d'IA constituent toute son éducation visuelle et linguistique : la totalité de ce qu'il a vu et associé au langage, à partir de laquelle il génère tout ce qu'il produit.
Astuce de pro
Lorsqu'un modèle échoue à plusieurs reprises à produire un type de contenu spécifique de manière convaincante : une esthétique inhabituelle, une démographie qui semble visuellement incohérente, un contexte culturel que le modèle rend avec un langage visuel générique ou inexact, essayez de décrire les qualités visuelles que vous souhaitez en termes concrets et précis plutôt que de vous fier à une étiquette que le modèle peut ne pas associer à un concept visuel précis. Au lieu d'un prompt qui nomme une tradition esthétique spécifique, décrivez ses caractéristiques visuelles : la température de couleur, la qualité de l'éclairage, les conventions compositionnelles, les textures des matières. Cela traduit votre intention en un langage visuel que le modèle peut faire correspondre à son entraînement, en contournant l'association potentiellement faible entre l'étiquette et le concept visuel.
Types et variantes
- Les données d'entraînement pour les modèles de génération par IA prennent plusieurs formes selon la modalité et la tâche entraînée.
- Les paires image-texte constituent le type de dataset principal pour les modèles text-to-image : des millions ou des milliards d'images appariées à des descriptions, légendes ou métadonnées textuelles qui enseignent l'association entre langue et contenu visuel.
- Pour les modèles de génération vidéo, les données d'entraînement s'étendent aux clips vidéo accompagnés de descriptions, capturant les schémas de mouvement temporel et la dynamique de scène en plus du contenu visuel statique.
- Les données d'entraînement synthétiques : images et vidéos générées par d'autres systèmes d'IA ou rendues à partir d'actifs 3D, sont de plus en plus utilisées pour compléter les données collectées de manière organique, en particulier pour couvrir des types de sujets, des conditions visuelles ou des scénarios liés à la sécurité rares dans les données naturelles.
- Les données de fine-tuning forment un dataset plus petit et soigneusement sélectionné, utilisé pour adapter un modèle de base pré-entraîné à un style, un sujet ou un domaine spécifique sans réentraîner depuis zéro : un volume bien plus modeste d'exemples hautement pertinents utilisés pour ajuster le comportement du modèle de manière ciblée.
Prêt à créer votre première scène dans Morphic ?
Essayer MorphicCas d’usage courants
- Les considérations sur les données d'entraînement sont les plus utiles en pratique au moment de sélectionner des modèles pour des projets spécifiques et de diagnostiquer un comportement de génération inattendu.
- Choisir entre plusieurs modèles de génération vidéo par IA pour un projet aux exigences esthétiques précises : un style visuel particulier, un type de sujet ou un besoin de représentation, gagne à comprendre les caractéristiques des données d'entraînement de chacun, qui sont généralement corrélées aux types de contenu pour lesquels il est publiquement reconnu comme produisant de bons résultats.
- Lorsqu'un modèle échoue régulièrement à générer un style, une démographie ou un contexte spécifique de manière convaincante, la sous-représentation dans les données d'entraînement en est la cause la plus probable : un diagnostic utile qui éclaire la décision de continuer à formuler, de changer de modèle ou d'investir dans le fine-tuning avec des exemples pertinents.
- Comprendre les données d'entraînement est également un contexte essentiel pour évaluer les implications éthiques de l'utilisation des outils de génération par IA, en particulier autour du consentement, de l'attribution et de la représentation.
Prêt à créer ?
Réalisez des scènes, créez des personnages, livrez des films entiers
Plateforme créative IA tout-en-un, avec une tarification simple et transparente, sans bridage de vitesse, et un Canvas infini pour une créativité maximale.