Question 1

Qu'est-ce que la génération IA image-vers-image ?

Accepted Answer

L'image-vers-image est un flux de génération dans lequel une image existante sert d'entrée aux côtés d'un prompt textuel, le modèle transformant la source tout en préservant des aspects de sa composition ou structure. Il diffère de la génération texte-vers-image, qui construit entièrement à partir d'une description écrite sans point de départ visuel.

Question 2

Qu'est-ce que la force de débruitage en image-vers-image ?

Accepted Answer

La force de débruitage contrôle à quel point le modèle transforme l'image source. À de faibles valeurs (proches de 0), la sortie ressemble étroitement à la source avec des changements minimes. À des valeurs élevées (proches de 1), la source ne fournit qu'une suggestion structurelle approximative et le modèle applique une transformation substantielle. La valeur optimale dépend de combien de la composition originale doit être préservée par rapport à réimaginée.

Question 3

En quoi l'image-vers-image diffère-t-elle du texte-vers-image ?

Accepted Answer

Le texte-vers-image génère une image entièrement à partir d'une description écrite, en partant du bruit aléatoire sans point de départ visuel. L'image-vers-image utilise une image existante comme initialisation partielle : démarrant le processus de débruitage avec une structure visuelle déjà en place : et le prompt textuel guide la façon dont cette structure est transformée plutôt que de décrire la composition complète à partir de zéro.

Question 4

Qu'est-ce qu'img2img ?

Accepted Answer

Img2img est l'abréviation courante pour image-vers-image, largement utilisée au sein de la communauté Stable Diffusion et dans les interfaces des outils. Les termes sont utilisés de manière interchangeable et se réfèrent à la même approche de génération dans laquelle une image existante est utilisée comme entrée aux côtés d'un prompt textuel pour guider la transformation.

Question 5

Puis-je utiliser l'image-vers-image pour changer le style d'une photographie ?

Accepted Answer

Oui. Appliquer un style artistique à une photographie tout en préservant sa composition est l'une des utilisations les plus courantes de la génération image-vers-image. En réglant une force de débruitage modérée et en incluant un prompt décrivant le style, le modèle peut transformer le traitement visuel de la photographie tout en conservant ses sujets, son cadrage et ses relations spatiales.

Question 6

Qu'est-ce que ControlNet et comment se rapporte-t-il à l'image-vers-image ?

Accepted Answer

ControlNet est un système de contrôle conditionnel pour les modèles de diffusion qui utilise des informations structurelles extraites d'une image source ( comme des cartes de contours, des cartes de profondeur ou des squelettes de pose ) comme conditionnement précis plutôt que comme initialisation directe des pixels. C'est une forme plus avancée de conditionnement basé sur l'image qui permet à des qualités structurelles spécifiques d'être préservées de manière beaucoup plus fiable que le img2img standard, et est largement utilisé pour le contrôle de pose de personnage, la correspondance de mise en page architecturale et autres cas où une adhérence structurelle précise est critique.

Question 7

Quelle est la différence entre image-vers-image et inpainting ?

Accepted Answer

L'image-vers-image applique une transformation à l'image entière ou à une partie substantielle de celle-ci, guidée par la structure visuelle de la source. L'inpainting applique la génération spécifiquement à une région masquée, laissant les zones non masquées inchangées. Pour corriger ou remplacer des petites zones spécifiques d'une image autrement acceptable, l'inpainting est plus précis ; pour appliquer une transformation stylistique globale à la composition complète, l'image-vers-image est l'approche la plus appropriée.

Question 8

Quelles entrées l'image-vers-image nécessite-t-elle ?

Accepted Answer

L'image-vers-image standard nécessite l'image source, un prompt textuel décrivant la sortie souhaitée et une valeur de force de débruitage. Certains flux ajoutent un conditionnement supplémentaire tel que des prompts négatifs pour exclure des éléments indésirables, des valeurs de seed pour la reproductibilité et des paramètres spécifiques au modèle. Les flux plus avancés utilisant ControlNet nécessitent également de spécifier quel type de conditionnement structurel extraire de l'image source.

Image-vers-image

Qu’est-ce que Image-vers-image ?

Réalisez des scènes, créez des personnages, livrez des films entiers

Types et variantes

Prêt à créer votre première scène dans Morphic ?

Cas d’usage courants

Réalisez des scènes, créez des personnages, livrez des films entiers

FAQ