En apprentissage automatique et en IA, les paramètres sont les valeurs numériques internes ( poids et biais ) qui définissent le comportement d'un modèle entraîné. Ils constituent le cœur de ce qu'un modèle « sait » : le produit du processus d'entraînement, encodant les relations statistiques apprises entre les entrées et les sorties que le modèle a découvertes en étant exposé à de vastes quantités de données d'entraînement. Chaque fois qu'un réseau de neurones traite une entrée, il multiplie, additionne et transforme les valeurs d'entrée à travers l'architecture du réseau au moyen de ces paramètres, produisant une sortie qui reflète ce que le modèle a appris à associer à des entrées de ce type. Avant l'entraînement, les paramètres sont initialisés à de petites valeurs aléatoires ; pendant l'entraînement, ils sont ajustés de manière itérative par optimisation afin de minimiser l'écart entre les sorties du modèle et les sorties correctes. Après l'entraînement, les paramètres sont fixés et constituent le modèle enregistré : le fichier ou le système avec lequel les utilisateurs interagissent à travers les outils de génération.
Le nombre de paramètres d'un modèle est fréquemment cité comme un indicateur de son échelle et de ses capacités. Les grands modèles de langage et les modèles de génération d'images modernes contiennent des milliards de paramètres ( GPT-3 en compte 175 milliards, les modèles plus volumineux dépassent le billion ) ce qui reflète l'ampleur de la capacité représentationnelle nécessaire pour modéliser la complexité du langage naturel, des images ou de la vidéo avec une qualité élevée. Cependant, le seul nombre de paramètres n'est pas un indicateur complet de qualité ou de capacité : la conception de l'architecture, la qualité des données d'entraînement, la méthodologie d'entraînement et le domaine de tâche spécifique influent tous fortement sur ce qu'un nombre donné de paramètres peut accomplir. Un modèle plus petit entraîné sur des données spécialisées de haute qualité peut surpasser un modèle généraliste beaucoup plus grand sur des tâches spécifiques au sein de ce domaine. L'efficacité de l'utilisation des paramètres ( la capacité qu'apporte chaque paramètre ) est un domaine de recherche actif en IA, avec des innovations architecturales comme les modèles parcimonieux et les approches de mélange d'experts qui permettent une capacité effective plus grande sans augmenter proportionnellement le nombre de paramètres utilisés pour chaque inférence individuelle.
Dans le contexte des outils de génération par IA, le terme « paramètres » a un second sens, plus accessible, dans l'usage courant : les réglages et contrôles ajustables par l'utilisateur exposés à travers l'interface d'une plateforme de génération — échelle CFG, étapes, seed, niveau de bruit, échantillonneur et valeurs similaires : sont souvent appelés familièrement « paramètres de génération » ou « paramètres de prompt ». Cet usage est techniquement distinct des paramètres du modèle (qui sont fixés après l'entraînement et non accessibles à l'utilisateur), mais les deux sens du mot décrivent des valeurs numériques qui façonnent les sorties : les paramètres du modèle déterminent ce que le modèle peut faire ; les paramètres de génération déterminent comment la capacité du modèle est appliquée à une tâche de génération spécifique. Comprendre ces deux usages ( et leur relation ) est fondamental pour travailler efficacement avec les systèmes de génération par IA.