Glossaryarrow
Bruit / Niveau de bruit
Bruit / Niveau de bruit

Dans le contexte de la génération d'images et de vidéos par IA, en particulier des modèles de diffusion, le bruit désigne une variation statistique aléatoire ajoutée à ou présente dans les données d'image, mathématiquement similaire au grésillement visuel d'un téléviseur analogique non syntonisé ou au grain d'une pellicule sous-exposée. Dans les modèles de diffusion, le bruit joue un rôle spécifique et central dans le processus de génération : le modèle est entraîné à inverser un processus d'ajout de bruit, apprenant à éliminer progressivement le bruit d'une image bruitée jusqu'à ce qu'une image propre et reconnaissable émerge. La génération commence par du bruit pur (un tenseur de valeurs aléatoires de mêmes dimensions que l'image cible) et le modèle prédit puis supprime itérativement des composantes de ce bruit sur une série d'étapes, guidé par le prompt textuel ou tout autre signal de conditionnement, jusqu'à ce qu'une image structurée et cohérente soit produite à partir de ce qui était une randomité complète. Le niveau de bruit à un point donné de ce processus de débruitage représente la quantité de bruit restant, l'étape initiale étant le bruit maximal et l'étape finale étant l'image entièrement résolue.

Le niveau de bruit devient un paramètre contrôlable par l'utilisateur dans plusieurs contextes. Lors de la génération à partir d'une image de départ plutôt qu'à partir de bruit pur (génération image-vers-image), le niveau de bruit (souvent appelé denoising strength ou img2img strength) contrôle la quantité de bruit ajoutée à l'image d'entrée avant le début du processus de débruitage. Un niveau de bruit élevé signifie que plus de bruit est ajouté, donnant au modèle plus de liberté pour s'écarter de l'image d'origine dans sa reconstruction : essentiellement une transformation plus forte de l'entrée. Un niveau de bruit bas signifie que moins de bruit est ajouté, gardant la sortie du modèle plus proche de l'image d'origine : une transformation plus conservatrice. Ce paramètre est fondamental pour les workflows image-vers-image : il détermine l'équilibre entre la préservation de la structure de l'image d'entrée et la possibilité pour le modèle de la réinterpréter selon le prompt. À de très faibles niveaux de bruit, la sortie reflète étroitement la composition et la structure de l'entrée ; à de très hauts niveaux de bruit, la sortie utilise l'entrée seulement comme une référence lâche, la guidance du prompt prenant le pas.

Le niveau de bruit interagit également avec le nombre d'étapes du processus de génération. Davantage d'étapes de débruitage permettent au modèle de faire des ajustements plus fins et plus incrémentaux à mesure qu'il supprime le bruit, produisant généralement des sorties de meilleure qualité et plus détaillées, mais au prix d'un temps de calcul accru. Moins d'étapes produisent des résultats plus rapides qui peuvent manquer de détails fins ou présenter des artefacts visibles dus à la résolution de débruitage plus grossière. Le schéma de bruit, c'est-à-dire la vitesse à laquelle le modèle passe d'un bruit élevé à un bruit faible au cours des étapes de débruitage, est un autre paramètre qui affecte la qualité et le style de génération, géré par l'algorithme d'échantillonnage choisi pour la génération. Comprendre le bruit et le niveau de bruit dans ce contexte aide les utilisateurs à saisir pourquoi certains comportements de génération se produisent : pourquoi les transformations image-vers-image à forte intensité s'écartent si nettement de l'entrée, pourquoi davantage d'étapes tendent à améliorer les détails fins, et pourquoi le même prompt peut produire des résultats sensiblement différents selon le bruit aléatoire de départ (la seed).

Can't find what you are looking for?
Contact us and let us know.
bg