Question 1

Qu'est-ce que ControlNet ?

Accepted Answer

ControlNet est une architecture de réseau de neurones qui ajoute un contrôle spatial aux modèles de génération d'images en conditionnant le processus de génération sur des images d'entrée structurelles telles que des cartes de pose, des cartes de contours ou des cartes de profondeur. Il permet aux créateurs de spécifier la structure compositionnelle et spatiale des sorties générées avec une bien plus grande précision que les seules invites textuelles.

Question 2

Comment fonctionne ControlNet ?

Accepted Answer

ControlNet entraîne des modules de réseau de neurones supplémentaires qui traitent les images de contrôle structurelles parallèlement au modèle de diffusion de base. Ces modules extraient l'information spatiale de l'entrée de contrôle et la transmettent comme conditionnement au processus de génération, en contraignant l'emplacement des éléments dans la sortie sans écraser le style visuel du modèle de base.

Question 3

Quels types d'entrées de contrôle ControlNet prend-il en charge ?

Accepted Answer

ControlNet prend en charge les cartes de pose pour le contrôle de la position du corps, les cartes de contours pour le contrôle des lignes structurelles, les cartes de profondeur pour les relations spatiales de profondeur, les cartes de segmentation pour le contrôle régional du contenu et les cartes de normales pour le contrôle de la géométrie des surfaces, entre autres. Plusieurs types de contrôle peuvent être utilisés simultanément.

Question 4

Quelle est la différence entre ControlNet et la génération image-vers-image ?

Accepted Answer

L'image-vers-image utilise une image de référence directement, influençant à la fois la structure et le contenu visuel. ControlNet extrait une information structurelle spécifique d'une référence et n'utilise que celle-ci comme contrainte spatiale, laissant le texte et le modèle de base déterminer le contenu visuel et le style indépendamment de l'apparence de la référence.

Question 5

À quoi sert le ControlNet de pose ?

Accepted Answer

Le ControlNet de pose utilise des cartes de points-clés de squelette pour garantir que les personnages générés respectent une position corporelle précise. Il est largement utilisé pour générer des variantes de personnages dans des poses identiques, faire correspondre une pose de référence pour la visualisation de produits ou de mode, et garantir une posture de personnage cohérente sur plusieurs générations.

Question 6

ControlNet peut-il être utilisé avec n'importe quel modèle de génération d'images ?

Accepted Answer

Les modules ControlNet sont spécifiques à une architecture et doivent être compatibles avec le modèle de base. La majeure partie du développement de ControlNet a porté sur Stable Diffusion et ses variantes. Chaque architecture de modèle de base nécessite ses propres modules ControlNet entraînés pour cette architecture spécifique.

Question 7

Que signifie le poids dans ControlNet ?

Accepted Answer

Le poids ControlNet détermine l'intensité avec laquelle le conditionnement spatial du module de contrôle influence la sortie générée. Des poids plus élevés produisent des sorties qui suivent plus précisément l'image de contrôle, mais peuvent réduire la qualité visuelle. Des poids plus faibles laissent davantage de liberté générative tout en appliquant une orientation spatiale directionnelle.

Question 8

ControlNet est-il utilisé dans les outils d'IA commerciaux ?

Accepted Answer

Les principes de ControlNet sont utilisés ou référencés dans de nombreux outils commerciaux de génération par IA, même si les implémentations varient. L'architecture est née dans l'écosystème open source de Stable Diffusion et a influencé la manière dont les fonctionnalités de contrôle spatial sont développées sur un éventail plus large de plateformes commerciales et de recherche en génération IA.

ControlNet

Qu’est-ce que ControlNet ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ