Guide pratique GPT Image 2 AI art pour maintenir un personnage reconnaissable entre scènes avec ancres d'identité, images de référence, templates de prompt, évaluation et dépannage.

Character bible showing a consistent AI art character across scenes

La cohérence de personnage est l'une des parties les plus difficiles de la production prompt-to-art. Une seule image peut être impressionnante, mais une histoire, un pitch de jeu, un deck concept, une page de BD ou une série character art exige plus : la même personne doit rester reconnaissable quand la caméra, la lumière, la tenue et l'émotion changent.

Ce guide s'adresse aux créateurs AI art qui utilisent des workflows de type GPT Image 2 pour le character art, le concept art et le développement visuel scène par scène. Il ne promet pas un verrouillage parfait de l'identité. La réalité pratique est simple : la cohérence est un workflow, pas une formule magique.

L'approche fiable consiste à structurer le processus : ancre de personnage, images de référence indexées, prompts en couches, petites éditions contrôlées, paramètres stables, historique de versions et méthode de revue qui détecte la dérive tôt.

Ce que signifie vraiment la cohérence de personnage

Layered prompt workflow for character consistency in AI art

En AI art, cohérence ne veut pas dire pixels identiques. Elle signifie que le spectateur croit voir le même personnage dans une séquence. Cette reconnaissance dépend de plusieurs indices stables :

Couche	Ce qui doit rester stable	Ce qui peut changer prudemment
Identité	géométrie du visage, âge apparent, carnation, indices ethniques, ligne de cheveux, longueur et texture des cheveux, cicatrices, tatouages, proportions du corps	expression, rotation de tête, ombre partielle, tension faciale
Styling	silhouette du vêtement, palette principale, accessoires signatures, langage postural	couches météo, dommages, saleté, variantes formelles, outerwear saisonnier
Scène	lieu, lumière, météo, caméra, pose, composition, medium	presque tout, si le changement de scène est déclaré

L'erreur est de traiter tous les détails comme équivalents. Le visage, la ligne de cheveux, les proportions, la silhouette de tenue et les accessoires portent l'identité. Le décor, la caméra, la lumière, la pose et la météo portent la scène. Si un prompt change les deux groupes à la fois, le modèle perd la priorité et le personnage dérive.

Un objectif réaliste : garder un personnage crédible sur 5 à 50 images, tout en permettant des variations contrôlées de pose, émotion, cadrage, lumière, météo et décor. Ne traitez pas un workflow prompt-only comme un système biométrique.

Commencer par une bible de personnage

Avant de demander vingt scènes, créez une bible de personnage. C'est le set de référence qui définit le personnage avant que l'histoire se complique.

Minimum utile :

Portrait frontal, lumière neutre, visage clair.
Plein pied, fond neutre, tenue complète.
Trois-quarts, montrant cheveux, nez, mâchoire et profil.
Expression sheet, avec émotions sous conditions contrôlées.

Nommez les fichiers simplement. Un système ennuyeux survit mieux aux révisions :

CHAR_A/
  bible/
    CHAR_A_face_front_v01.png
    CHAR_A_fullbody_v01.png
    CHAR_A_threequarter_v01.png
    CHAR_A_expressions_v01.png
  outfits/
    CHAR_A_outfit_core_v01.png
    CHAR_A_outfit_winter_v02.png
  scenes/
    SCN_001_rooftop_dusk_v01.json
    SCN_014_rain_alley_low_angle_v03.json

La bible doit être claire, stable et utile. Évitez lumière dramatique, angles extrêmes, motion blur et visages masqués dans les ancres. Ces images peuvent être belles, mais elles font de mauvaises références.

Utiliser des prompts en couches, pas une soupe de phrases

Les longs prompts ne sont pas automatiquement meilleurs. Un prompt maintenable sépare identité, styling, scène, caméra, lumière, style et contraintes.

Task:
Create a new scene featuring the same recurring character.

Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>

Scene:
<LOCATION_ACTION_STORY_BEAT>

Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>

Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>

Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>

Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range

Change only:
<CONTROLLED_SCENE_DELTA>

Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure

Ce n'est pas sophistiqué, et c'est précisément sa force. La hiérarchie est claire, réutilisable et facile à auditer quand une scène échoue.

L'instruction clé : préserver versus changer

Pour les éditions, il faut dire explicitement ce qui change et ce qui reste. C'est l'habitude la plus utile pour la cohérence.

Instruction faible :

Put the same woman in a snowy city at night.

Instruction plus forte :

Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.

La seconde version n'est pas du remplissage. Chaque phrase réduit un mode d'échec : nouveau visage, nouvelle tenue, nouvelle caméra ou dérive de marque.

Images de référence : donner un rôle à chaque image

Les images de référence sont le stabilisateur le plus fort, mais elles peuvent se contredire. Indexez-les et attribuez un rôle.

Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.

Répétez ce rôle dans le prompt :

Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.

Si une référence de style contient un beau personnage, le modèle peut absorber son visage. Si la référence de pose a d'autres vêtements, la tenue dérive. Gardez l'identité neutre, la tenue en plein pied, le style sans personnage si possible et la composition simple.

Construire les scènes par petites étapes

Changer cinq dimensions à la fois est un piège :

même personnage,
nouvelle tenue,
nouvelle pose,
nouvelle caméra,
nouvelle lumière,
nouveau medium,
nouveau lieu.

Séparez le travail :

Verrouiller visage et plein pied.
Placer le même personnage dans l'angle caméra cible.
Changer la pose.
Changer l'environnement.
Ajouter météo ou lumière.
Changer seulement l'outerwear ou la variante de costume.
Convertir le style seulement quand l'identité est stable.

Pour anime, aquarelle, comics ink et styles très marqués, écrivez explicitement "same facial proportions", "same hairstyle silhouette", "same color palette" et interdisez de rajeunir le personnage.

Pipeline de production pour 5 à 50 scènes

Ne générez pas tout avant de revoir. Vous obtiendrez une pile incohérente sans cause claire.

Étape	Sortie	Contrôle qualité
1. Définition	fiche d'identité et prompts d'ancre	indices précis, pas vagues
2. Bible	portrait, plein pied, trois-quarts, expressions	même personne dans toutes les ancres
3. Spec freeze	modèle, taille, qualité, références, template	comparaisons équitables
4. Plan scènes	un prompt structuré par scène	une variation principale par scène
5. Batch	2 à 4 candidats par scène	rejeter tôt dérives visage/tenue
6. Réparation ciblée	éditer seulement l'élément raté	répéter la preserve list
7. Revue finale	comparaison côte à côte avec ancres	identité, tenue et beat passent ensemble

Journalisez chaque image acceptée :

character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes

Ces notes évitent le chaos. Si la scène 14 est bonne et la 15 dérive, vous devez savoir ce qui a changé.

Templates de prompts à adapter

Template 1: Character Anchor From Scratch

Task:
Create a clean character anchor for a recurring AI art series.

Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded

Scene:
plain warm gray studio background, full body visible, standing naturally

Camera:
full body, eye-level, centered, natural 50mm portrait feel

Lighting:
soft studio light, neutral color temperature, clear face visibility

Style:
high-detail character concept art, clean realistic rendering

Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband

Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face

Template 2: New Scene With Reference Images

Task:
Create a new scene with the same recurring character.

Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.

Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs

Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel

Lighting:
neon reflections, sodium street light from the rear, cool rain haze

Style:
photorealistic cinematic concept art

Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband

Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley

Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo

Template 3: Style Conversion Without Losing Identity

Task:
Convert the existing character scene into a black-and-white comic ink style.

Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose

Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections

Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo

Évaluation : ne pas se fier seulement au ressenti

La revue humaine est nécessaire, mais un goût vague ne suffit pas. Créez un benchmark et réutilisez-le :

gros plan frontal,
visage trois-quarts,
plein pied,
pose assise,
course,
low-angle hero shot,
vue de dessus,
nuit pluvieuse,
nuit enneigée,
variante d'outerwear,
émotion forte,
conversion de style.

Générez plusieurs candidats avec les mêmes références et regardez-les à côté des ancres.

Question	Condition de réussite
Est-ce le même visage ?	géométrie majeure et âge apparent correspondent
L'âge reste-t-il stable ?	pas de rajeunissement ou vieillissement involontaire
Carnation et indices ethniques restent-ils stables ?	pas de recasting accidentel
La coiffure reste-t-elle stable ?	ligne, longueur, texture et silhouette reconnaissables
Les proportions restent-elles stables ?	taille, build et membres cohérents
La tenue centrale reste-t-elle stable ?	silhouette, palette et accessoires survivent
La scène réussit-elle ?	action, décor, caméra et humeur présents

Les mesures automatiques peuvent aider, mais ne sont pas le verdict final. Embeddings, similarité perceptuelle et scoring vision-langage échouent avec stylisation, occlusion, profil ou lumière forte.

Dépannage des dérives courantes

Problème	Symptôme	Correction rapide
Dérive du visage	yeux, mâchoire, nez ou ligne de cheveux ne correspondent plus	utiliser référence visage, répéter preserve list, réduire le changement
Dérive tenue	veste, couleurs, accessoires ou silhouette changent	ajouter référence plein pied, séparer tenue centrale et outerwear
Le style mange l'identité	anime ou aquarelle devient une autre personne	préciser mêmes proportions faciales et coiffure, convertir après stabilisation
Dérive caméra	angle, crop ou perspective changent	mettre shot size, angle, framing et lens feel dans camera block et preserve list
Spillover local	corriger une boucle d'oreille change cheveux ou visage	réduire l'édition, utiliser mask si possible, répéter change only
Surcopie référence	visage collé ou raide	utiliser plusieurs angles, autoriser expression et lumière différentes
Texte/logos apparaissent	lettres aléatoires, watermark, faux branding	garder "no text, no watermark, no logo" partout

La plupart des échecs viennent de trop de changements à la fois. Simplifiez, créez une étape intermédiaire propre, puis éditez une seule chose.

Conseils de paramètres pratiques

Gardez des paramètres stables dans un projet. Si vous changez modèle, taille, qualité, références et structure de prompt en même temps, vous ne saurez pas quelle variable a provoqué la dérive.

Utilisez portrait ou carré pour les ancres, paysage seulement si la scène l'exige. Séparez taille d'export finale et test d'identité. Pour les drafts, générez plusieurs candidats ; pour les finals, réduisez la variation et loggez prompt et références exacts.

N'inventez pas de contrôles non exposés dans votre interface GPT Image 2. Si seed, sampling steps ou guidance scale ne sont pas disponibles, ils ne font pas partie de votre système de répétabilité. Appuyez-vous sur références, structure, edits, image IDs ou previous responses si disponibles, taille stable, qualité stable et revue rigoureuse.

Conclusion

Le meilleur guide de prompts GPT Image 2 AI art pour la cohérence de personnage n'est pas un prompt secret. C'est une discipline :

définir le personnage avant l'histoire,
séparer identité et changement de scène,
donner un rôle à chaque référence,
faire de petites éditions,
préserver plus que changer,
enregistrer chaque run accepté,
comparer aux ancres,
réparer la dérive immédiatement.

C'est ainsi que les expériences prompt-to-art deviennent du character art, du concept art, du développement BD et des séquences de scènes utilisables.

Try GPT Image 2 for Free Now →

Guide de prompts GPT Image 2 AI Art pour garder un personnage cohérent