Guide de prompts GPT Image 2 AI Art pour garder un personnage cohérent
GPT Image 2 Team
10 mai 2026

Guide pratique GPT Image 2 AI art pour maintenir un personnage reconnaissable entre scènes avec ancres d'identité, images de référence, templates de prompt, évaluation et dépannage.

La cohérence de personnage est l'une des parties les plus difficiles de la production prompt-to-art. Une seule image peut être impressionnante, mais une histoire, un pitch de jeu, un deck concept, une page de BD ou une série character art exige plus : la même personne doit rester reconnaissable quand la caméra, la lumière, la tenue et l'émotion changent.
Ce guide s'adresse aux créateurs AI art qui utilisent des workflows de type GPT Image 2 pour le character art, le concept art et le développement visuel scène par scène. Il ne promet pas un verrouillage parfait de l'identité. La réalité pratique est simple : la cohérence est un workflow, pas une formule magique.
L'approche fiable consiste à structurer le processus : ancre de personnage, images de référence indexées, prompts en couches, petites éditions contrôlées, paramètres stables, historique de versions et méthode de revue qui détecte la dérive tôt.
Ce que signifie vraiment la cohérence de personnage

En AI art, cohérence ne veut pas dire pixels identiques. Elle signifie que le spectateur croit voir le même personnage dans une séquence. Cette reconnaissance dépend de plusieurs indices stables :
| Couche | Ce qui doit rester stable | Ce qui peut changer prudemment |
|---|---|---|
| Identité | géométrie du visage, âge apparent, carnation, indices ethniques, ligne de cheveux, longueur et texture des cheveux, cicatrices, tatouages, proportions du corps | expression, rotation de tête, ombre partielle, tension faciale |
| Styling | silhouette du vêtement, palette principale, accessoires signatures, langage postural | couches météo, dommages, saleté, variantes formelles, outerwear saisonnier |
| Scène | lieu, lumière, météo, caméra, pose, composition, medium | presque tout, si le changement de scène est déclaré |
L'erreur est de traiter tous les détails comme équivalents. Le visage, la ligne de cheveux, les proportions, la silhouette de tenue et les accessoires portent l'identité. Le décor, la caméra, la lumière, la pose et la météo portent la scène. Si un prompt change les deux groupes à la fois, le modèle perd la priorité et le personnage dérive.
Un objectif réaliste : garder un personnage crédible sur 5 à 50 images, tout en permettant des variations contrôlées de pose, émotion, cadrage, lumière, météo et décor. Ne traitez pas un workflow prompt-only comme un système biométrique.
Commencer par une bible de personnage
Avant de demander vingt scènes, créez une bible de personnage. C'est le set de référence qui définit le personnage avant que l'histoire se complique.
Minimum utile :
- Portrait frontal, lumière neutre, visage clair.
- Plein pied, fond neutre, tenue complète.
- Trois-quarts, montrant cheveux, nez, mâchoire et profil.
- Expression sheet, avec émotions sous conditions contrôlées.
Nommez les fichiers simplement. Un système ennuyeux survit mieux aux révisions :
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
La bible doit être claire, stable et utile. Évitez lumière dramatique, angles extrêmes, motion blur et visages masqués dans les ancres. Ces images peuvent être belles, mais elles font de mauvaises références.
Utiliser des prompts en couches, pas une soupe de phrases
Les longs prompts ne sont pas automatiquement meilleurs. Un prompt maintenable sépare identité, styling, scène, caméra, lumière, style et contraintes.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
Ce n'est pas sophistiqué, et c'est précisément sa force. La hiérarchie est claire, réutilisable et facile à auditer quand une scène échoue.
L'instruction clé : préserver versus changer
Pour les éditions, il faut dire explicitement ce qui change et ce qui reste. C'est l'habitude la plus utile pour la cohérence.
Instruction faible :
Put the same woman in a snowy city at night.
Instruction plus forte :
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
La seconde version n'est pas du remplissage. Chaque phrase réduit un mode d'échec : nouveau visage, nouvelle tenue, nouvelle caméra ou dérive de marque.
Images de référence : donner un rôle à chaque image
Les images de référence sont le stabilisateur le plus fort, mais elles peuvent se contredire. Indexez-les et attribuez un rôle.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Répétez ce rôle dans le prompt :
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Si une référence de style contient un beau personnage, le modèle peut absorber son visage. Si la référence de pose a d'autres vêtements, la tenue dérive. Gardez l'identité neutre, la tenue en plein pied, le style sans personnage si possible et la composition simple.
Construire les scènes par petites étapes
Changer cinq dimensions à la fois est un piège :
- même personnage,
- nouvelle tenue,
- nouvelle pose,
- nouvelle caméra,
- nouvelle lumière,
- nouveau medium,
- nouveau lieu.
Séparez le travail :
- Verrouiller visage et plein pied.
- Placer le même personnage dans l'angle caméra cible.
- Changer la pose.
- Changer l'environnement.
- Ajouter météo ou lumière.
- Changer seulement l'outerwear ou la variante de costume.
- Convertir le style seulement quand l'identité est stable.
Pour anime, aquarelle, comics ink et styles très marqués, écrivez explicitement "same facial proportions", "same hairstyle silhouette", "same color palette" et interdisez de rajeunir le personnage.
Pipeline de production pour 5 à 50 scènes
Ne générez pas tout avant de revoir. Vous obtiendrez une pile incohérente sans cause claire.
| Étape | Sortie | Contrôle qualité |
|---|---|---|
| 1. Définition | fiche d'identité et prompts d'ancre | indices précis, pas vagues |
| 2. Bible | portrait, plein pied, trois-quarts, expressions | même personne dans toutes les ancres |
| 3. Spec freeze | modèle, taille, qualité, références, template | comparaisons équitables |
| 4. Plan scènes | un prompt structuré par scène | une variation principale par scène |
| 5. Batch | 2 à 4 candidats par scène | rejeter tôt dérives visage/tenue |
| 6. Réparation ciblée | éditer seulement l'élément raté | répéter la preserve list |
| 7. Revue finale | comparaison côte à côte avec ancres | identité, tenue et beat passent ensemble |
Journalisez chaque image acceptée :
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Ces notes évitent le chaos. Si la scène 14 est bonne et la 15 dérive, vous devez savoir ce qui a changé.
Templates de prompts à adapter
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Évaluation : ne pas se fier seulement au ressenti
La revue humaine est nécessaire, mais un goût vague ne suffit pas. Créez un benchmark et réutilisez-le :
- gros plan frontal,
- visage trois-quarts,
- plein pied,
- pose assise,
- course,
- low-angle hero shot,
- vue de dessus,
- nuit pluvieuse,
- nuit enneigée,
- variante d'outerwear,
- émotion forte,
- conversion de style.
Générez plusieurs candidats avec les mêmes références et regardez-les à côté des ancres.
| Question | Condition de réussite |
|---|---|
| Est-ce le même visage ? | géométrie majeure et âge apparent correspondent |
| L'âge reste-t-il stable ? | pas de rajeunissement ou vieillissement involontaire |
| Carnation et indices ethniques restent-ils stables ? | pas de recasting accidentel |
| La coiffure reste-t-elle stable ? | ligne, longueur, texture et silhouette reconnaissables |
| Les proportions restent-elles stables ? | taille, build et membres cohérents |
| La tenue centrale reste-t-elle stable ? | silhouette, palette et accessoires survivent |
| La scène réussit-elle ? | action, décor, caméra et humeur présents |
Les mesures automatiques peuvent aider, mais ne sont pas le verdict final. Embeddings, similarité perceptuelle et scoring vision-langage échouent avec stylisation, occlusion, profil ou lumière forte.
Dépannage des dérives courantes
| Problème | Symptôme | Correction rapide |
|---|---|---|
| Dérive du visage | yeux, mâchoire, nez ou ligne de cheveux ne correspondent plus | utiliser référence visage, répéter preserve list, réduire le changement |
| Dérive tenue | veste, couleurs, accessoires ou silhouette changent | ajouter référence plein pied, séparer tenue centrale et outerwear |
| Le style mange l'identité | anime ou aquarelle devient une autre personne | préciser mêmes proportions faciales et coiffure, convertir après stabilisation |
| Dérive caméra | angle, crop ou perspective changent | mettre shot size, angle, framing et lens feel dans camera block et preserve list |
| Spillover local | corriger une boucle d'oreille change cheveux ou visage | réduire l'édition, utiliser mask si possible, répéter change only |
| Surcopie référence | visage collé ou raide | utiliser plusieurs angles, autoriser expression et lumière différentes |
| Texte/logos apparaissent | lettres aléatoires, watermark, faux branding | garder "no text, no watermark, no logo" partout |
La plupart des échecs viennent de trop de changements à la fois. Simplifiez, créez une étape intermédiaire propre, puis éditez une seule chose.
Conseils de paramètres pratiques
Gardez des paramètres stables dans un projet. Si vous changez modèle, taille, qualité, références et structure de prompt en même temps, vous ne saurez pas quelle variable a provoqué la dérive.
Utilisez portrait ou carré pour les ancres, paysage seulement si la scène l'exige. Séparez taille d'export finale et test d'identité. Pour les drafts, générez plusieurs candidats ; pour les finals, réduisez la variation et loggez prompt et références exacts.
N'inventez pas de contrôles non exposés dans votre interface GPT Image 2. Si seed, sampling steps ou guidance scale ne sont pas disponibles, ils ne font pas partie de votre système de répétabilité. Appuyez-vous sur références, structure, edits, image IDs ou previous responses si disponibles, taille stable, qualité stable et revue rigoureuse.
Conclusion
Le meilleur guide de prompts GPT Image 2 AI art pour la cohérence de personnage n'est pas un prompt secret. C'est une discipline :
- définir le personnage avant l'histoire,
- séparer identité et changement de scène,
- donner un rôle à chaque référence,
- faire de petites éditions,
- préserver plus que changer,
- enregistrer chaque run accepté,
- comparer aux ancres,
- réparer la dérive immédiatement.
C'est ainsi que les expériences prompt-to-art deviennent du character art, du concept art, du développement BD et des séquences de scènes utilisables.

![[fr] Advanced Prompt Workflows for Designers in GPT Image 2](https://gpt-image-2.live/blog-assets/f7f88ae7fe45ba37/hero-replicate.webp)
