Question 1

Que sont les données d'entraînement en IA, et pourquoi sont-elles importantes ?

Accepted Answer

Les données d'entraînement sont l'ensemble des contenus existants ( images, textes, vidéos, audio ) dont un modèle d'IA apprend pendant son développement. Pour l'IA générative, les données d'entraînement sont la source de tout ce que le modèle sait : à quoi ressemblent les sujets, comment se caractérisent les styles, comment le langage se relie au contenu visuel. La composition des données d'entraînement détermine directement ce qu'un modèle peut générer avec assurance, ce avec quoi il a des difficultés et quels biais ou lacunes de représentation apparaissent dans ses sorties. Comprendre les données d'entraînement est fondamental pour comprendre pourquoi les modèles d'IA se comportent comme ils le font.

Question 2

Comment les données d'entraînement affectent-elles ce qu'une IA peut générer ?

Accepted Answer

Un modèle apprend à générer du contenu en reconnaissant et en reproduisant des schémas statistiques dans ses données d'entraînement. Les types de contenu qui apparaissent fréquemment et avec des exemples diversifiés seront générés avec une qualité et une cohérence supérieures à ceux qui étaient rares ou absents dans l'ensemble d'entraînement. Un modèle entraîné principalement sur de la photographie professionnelle produira des images plus nettes et mieux composées qu'un modèle entraîné sur du matériel de moindre qualité. Un modèle dont les données d'entraînement étaient peu fournies en certaines traditions esthétiques, démographies ou sujets produira des résultats incohérents ou inexacts dans ces domaines, reflétant les limites de son éducation visuelle.

Question 3

Quels sont les enjeux éthiques autour des données d'entraînement pour la génération par IA ?

Accepted Answer

Les principales préoccupations éthiques liées aux données d'entraînement d'IA concernent le consentement, l'attribution et la représentation. La plupart des grands modèles génératifs sont entraînés sur de vastes quantités de contenus internet publiquement accessibles, qui incluent généralement des œuvres créatives d'artistes et de photographes n'ayant pas explicitement consenti à ce que leur travail soit utilisé pour l'entraînement de modèles. Cela soulève des questions non résolues sur la propriété intellectuelle et les droits des créateurs. Le biais de représentation est une autre préoccupation : les données d'entraînement issues principalement de sources internet anglophones tendent à surreprésenter certaines démographies, traditions esthétiques et contextes culturels, intégrant ces biais dans les sorties par défaut du modèle.

Question 4

Que sont les données de fine-tuning et en quoi diffèrent-elles des données d'entraînement ?

Accepted Answer

Les données d'entraînement constituent le dataset massif utilisé pour entraîner un modèle depuis zéro, établissant sa connaissance visuelle et linguistique fondamentale sur un large éventail. Les données de fine-tuning forment un dataset bien plus petit et hautement sélectionné, utilisé pour adapter un modèle déjà entraîné à un style, un sujet ou un domaine spécifique sans réentraîner depuis zéro. Là où les données d'entraînement peuvent être composées de milliards de paires image-texte, les données de fine-tuning pour une adaptation stylistique spécifique peuvent être composées de centaines ou de quelques milliers d'exemples soigneusement choisis. Le fine-tuning ajuste le comportement du modèle dans des domaines ciblés tout en préservant ses capacités plus larges issues de l'entraînement initial.

Question 5

Pourquoi un modèle d'IA produit-il parfois des résultats incohérents ou inexacts pour certains sujets ?

Accepted Answer

Une génération incohérente ou inexacte pour des sujets spécifiques reflète presque toujours la sous-représentation ou la mauvaise représentation de ces sujets dans les données d'entraînement du modèle. Si l'ensemble d'entraînement contenait peu d'exemples d'un style visuel, d'un contexte culturel, d'un type de sujet ou d'une démographie particuliers, le modèle aura appris une représentation moins précise et moins cohérente de ceux-ci. Cela se manifeste par une génération qui manque les caractéristiques distinctives, confond la cible avec des concepts visuels plus courants ou produit des résultats techniquement corrects mais culturellement génériques. Le fine-tuning avec des exemples pertinents peut combler ces lacunes pour des besoins de production spécifiques.

Question 6

Comment la compréhension des données d'entraînement peut-elle m'aider à mieux utiliser les outils de génération par IA ?

Accepted Answer

Comprendre les données d'entraînement vous aide à choisir le bon outil pour une tâche, à établir des attentes réalistes et à diagnostiquer les problèmes de génération de manière productive. Au moment de choisir entre des modèles pour un projet aux exigences esthétiques spécifiques, les modèles entraînés sur des datasets bien fournis dans le style ou le type de contenu pertinent fonctionneront de manière plus fiable. Lorsqu'un modèle échoue régulièrement sur un sujet spécifique, le reconnaître comme une lacune des données d'entraînement plutôt qu'une erreur de prompt vous indique qu'il faut changer d'outil, adapter votre approche pour décrire les qualités visuelles plutôt que d'étiqueter un concept, ou investir dans le fine-tuning. Ce cadre de diagnostic évite d'itérer inutilement sur des problèmes de formulation qui sont en réalité des problèmes de sélection de modèle.

Question 7

Quels types de contenu tendent à être bien représentés dans les données d'entraînement des IA génératives ?

Accepted Answer

Les modèles d'IA générative entraînés sur des données issues d'internet tendent à être bien représentés dans les contenus abondants sur l'internet anglophone : esthétiques photographiques occidentales contemporaines, styles visuels commerciaux mainstream, sujets couramment photographiés comme les paysages et les portraits de certaines démographies, styles artistiques bien connus disposant d'une importante audience en ligne, et contextes visuels techniques comme l'architecture et la photographie de produit. Les contenus qui tendent à être moins bien représentés incluent les traditions visuelles non occidentales, les esthétiques régionales et culturelles sous-représentées dans les archives en ligne anglophones, les styles visuels historiques aux exemples numérisés limités et les groupes démographiques qui apparaissent moins fréquemment dans la culture visuelle en ligne dominante.

Question 8

Puis-je ajouter mes propres données d'entraînement à un modèle d'IA ?

Accepted Answer

Pas à un modèle de base directement : les modèles de base sont entraînés par les entreprises qui les développent sur de grands datasets et ne sont généralement pas accessibles pour un réentraînement par les utilisateurs finaux. Cependant, la plupart des grandes plateformes de génération par IA proposent des capacités de fine-tuning qui permettent aux créateurs d'adapter un modèle de base pré-entraîné à l'aide de leurs propres exemples. En fournissant un ensemble sélectionné d'images représentant un personnage, un style ou un sujet spécifique, les créateurs peuvent mettre à jour les poids du modèle pour générer ce contenu de manière plus fiable. Des plateformes comme Morphic prennent en charge l'entraînement de modèles personnalisés via l'onglet Assets, où les modèles entraînés deviennent disponibles pour la génération au sein du workflow du projet.

Données d'entraînement (Training Data)

Qu’est-ce que Données d'entraînement (Training Data) ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ