Comprendre et Dompter ComfyUI
Concept général
ComfyUI, c’est le LEGO de la génération d’images par IA (et vidéo).
Là où d’autres interfaces comme Automatic1111 se contentent de sliders et de champs de texte, ComfyUI te propose une vision nodale : tu construis ton workflow comme un schéma électronique ou un graphe réseau.
- Chaque nœud = une action précise (charger un modèle, ajouter un prompt, appliquer une upscale, etc.).
- Tu relies les nœuds entre eux = tu crées ta pipeline de génération.
- Résultat : contrôle total, pas de “boîte noire”, et surtout la possibilité d’automatiser et d’expérimenter.
Bref, ComfyUI c’est la console terminal + interface visuelle de la génération d’images.
Vocabulaire & Concepts essentiels
🔹 Les modèles
- SD (Stable Diffusion 1.4/1.5) : la “base historique”. Rapide, léger, mais limité dans les détails.
- SDXL (Stable Diffusion XL) : la nouvelle star. Plus lourd, mais beaucoup plus précis. Idéal pour du photoréalisme ou des détails complexes.
- SDXL Turbo : optimisé vitesse. Moins de finesse, mais très utile pour prototyper.
- Anime & Styles spécifiques (Anything, Dreamshaper, etc.) : modèles spécialisés pour un rendu artistique (manga, peinture, cartoon…).
- Inpainting Models : pour corriger ou éditer une partie d’image.
- ControlNet Models : pour guider l’image à partir d’une pose, d’un croquis, d’une profondeur, etc.
- LoRA (Low Rank Adaptation) : mini-modèles spécialisés (ex : un style artistique, un personnage). Plug-and-play dans SD ou SDXL.
🔹 Les nœuds principaux
- Load Checkpoint / Model Loader : charge ton modèle (SD, SDXL, etc.).
- CLIP Text Encode : traduit ton prompt en vecteurs pour l’IA.
- KSampler : cœur de la génération → il fabrique l’image à partir du bruit et des prompts.
- VAE Decode : convertit la sortie de l’IA en image “lisible”.
- Save Image : ton point de sortie.
- Conditioning (Positif / Négatif) : gère ce que tu veux voir et ce que tu ne veux surtout pas (ex : “sans watermark, sans flou”).
- ControlNet : pour guider la génération avec des références (pose, esquisse, segmentation).
- Upscaler : augmente la résolution et les détails.
- LoRA Loader : ajoute une spécialisation.
🔹 Les formats & poids
- .ckpt / .safetensors : poids des modèles.
- VAE : fichiers pour gérer la compression des couleurs & détails.
- .json / .png (workflow) : les schémas de nœuds peuvent être exportés → un PNG peut contenir ton workflow directement.
Bonnes pratiques
- Commence simple
→ Modèle SDXL + prompt basique + négatif prompt + upscale = workflow minimal. - Sépare les blocs
→ Crée des workflows modulaires (un pour génération, un pour upscale, un pour inpainting). - Nomme tes nœuds
→ Quand tu reviens plus tard sur un workflow complexe, un “CLIP Encode 5” ne veut rien dire. Mets des labels clairs. - Prompt engineering
- Positif = description, style, ambiance.
- Négatif = les “déchets” (mains ratées, artefacts, flou).
- Utilise des poids (ex :
(hyperrealistic:1.3)
) pour influencer la balance.
- KSampler tuning
- Steps (20–30) = détail.
- CFG Scale (6–8) = équilibre entre fidélité au prompt et créativité.
- Seed = graine aléatoire → pour retrouver une image, garde-la précieusement.
- Contrôle du GPU
- SD = tourne même sur 4–6 Go VRAM.
- SDXL = confortable à partir de 8–12 Go.
- Utilise le batch ou le low VRAM mode si tu es limité.
- Versionning de workflows
→ Sauvegarde tes workflows par thème (“Portrait Stylisé”, “Architecture Futuriste”, “Manga”).
Niveaux de workflows
- Débutant :
Load Model → Encode Prompt → KSampler → Decode → Save Image. - Intermédiaire :
Ajout ControlNet, LoRA, upscale, gestion fine du prompt. - Avancé :
Multiples pipelines parallèles (ex : génération → correction → upscale → stylisation → export).
Conclusion façon TOCH
ComfyUI, c’est l’atelier clandestin du hacker visuel.
Il ne faut pas le voir comme un “outil magique qui fait tout tout seul”, mais comme une boîte à outils où tu maîtrises chaque boulon.
👉 Débutant ? Commence avec un SDXL simple et des prompts.
👉 Intermédiaire ? Joue avec ControlNet et LoRA.
👉 Avancé ? Crée des workflows modulaires, partage tes PNG, et deviens le maître Jedi de la génération nodale.