Guida ai prompt GPT Image 2 AI Art per la coerenza dei personaggi
GPT Image 2 Team
10 maggio 2026

Guida pratica GPT Image 2 AI art per mantenere riconoscibili i personaggi tra scene, con ancore d'identità, immagini di riferimento, template di prompt, valutazione e troubleshooting.

La coerenza dei personaggi è una delle parti più difficili della produzione prompt-to-art. Una singola immagine può funzionare, ma una storia, un pitch di gioco, un concept deck, una pagina di fumetto o una serie di character art richiedono di più: la stessa persona deve restare riconoscibile quando cambiano camera, luce, outfit ed emozione.
Questa guida è per creator AI art che usano workflow in stile GPT Image 2 per character art, concept art e sviluppo scena per scena. Non promette un blocco identità perfetto. La verità pratica è che la coerenza è un workflow, non una formula magica.
Il metodo affidabile è ingegnerizzare il processo: ancora del personaggio, riferimenti indicizzati, prompt stratificati, piccole modifiche controllate, impostazioni stabili, log di versione e review che intercetta la deriva presto.
Cosa significa davvero coerenza del personaggio

In AI art, coerenza non significa pixel identici. Significa che lo spettatore crede di vedere lo stesso personaggio in una sequenza. Il riconoscimento dipende da segnali stabili:
| Livello | Da mantenere stabile | Può cambiare con cautela |
|---|---|---|
| Identità | geometria del volto, fascia d'età, tono pelle, indizi etnici, attaccatura, lunghezza e texture capelli, cicatrici, tatuaggi, proporzioni | espressione, rotazione testa, ombra parziale, tensione facciale |
| Styling | silhouette abiti, palette base, accessori firma, linguaggio posturale | strati meteo, danni, sporco, varianti formali, outerwear stagionale |
| Scena | luogo, luce, meteo, camera, posa, composizione, medium | quasi tutto, se dichiarato come cambio scena |
L'errore è trattare tutti i dettagli allo stesso modo. Volto, attaccatura, proporzioni, silhouette outfit e accessori portano identità; sfondo, camera, luce, posa e meteo portano scena. Se il prompt cambia entrambi i gruppi, il modello non sa cosa preservare.
Obiettivo realistico: mantenere un personaggio credibile in 5-50 immagini, permettendo variazioni controllate di posa, emozione, framing, luce, meteo e scena. Un prompt-only workflow non è un sistema biometrico.
Parti da una character bible
Prima di chiedere venti scene, crea una character bible: il set di riferimenti che definisce il personaggio prima che la storia diventi complessa.
Minimo utile:
- Ritratto frontale, luce neutra, volto chiaro.
- Figura intera, sfondo neutro, outfit completo.
- Tre quarti, con capelli, naso, mascella e profilo leggibili.
- Expression sheet con emozioni controllate.
Usa nomi semplici. Un naming noioso sopravvive alle revisioni:
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
La bible deve essere chiara, stabile e utile. Evita luce drammatica, angoli estremi, motion blur o volto mezzo nascosto negli anchor.
Usa prompt stratificati, non una zuppa lunga
I prompt lunghi non sono automaticamente migliori. Un prompt mantenibile separa identità, styling, scena, camera, luce, stile e vincoli.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
Non è elegante, ed è il punto. Offre gerarchia chiara e puoi riusarlo senza riscrivere tutto.
L'istruzione chiave: preservare o cambiare
Nelle modifiche, dichiara cosa cambia e cosa resta. Per la coerenza è l'abitudine più utile.
Debole:
Put the same woman in a snowy city at night.
Più forte:
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
La seconda versione non è gonfia. Ogni frase riduce un errore frequente: nuovo volto, nuovo outfit, nuova camera o identità alterata.
Immagini di riferimento: un compito per ogni immagine
I riferimenti stabilizzano, ma possono contaminarsi. Usa ruoli indicizzati:
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Ripeti i ruoli nel prompt:
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Se una reference di stile contiene un personaggio, il modello può assorbirne il volto. Se una pose reference ha altri abiti, l'outfit può driftare. Meglio identità neutra, outfit a figura intera, stile senza personaggi se possibile e composizione semplice.
Costruisci scene a piccoli passi
Cambiare troppe dimensioni insieme è fragile:
- stesso personaggio,
- nuovo outfit,
- nuova posa,
- nuova camera,
- nuova luce,
- nuovo medium,
- nuovo luogo.
Dividi:
- Blocca volto e figura intera.
- Porta lo stesso personaggio nell'angolo camera target.
- Cambia posa.
- Cambia ambiente.
- Aggiungi meteo o luce.
- Cambia solo outerwear o variante costume.
- Converti stile solo dopo identità stabile.
Per anime, acquerello, comic ink e output stilizzati, scrivi "same facial proportions", "same hairstyle silhouette", "same color palette" e vieta di ringiovanire il personaggio.
Pipeline per 5-50 scene
Non generare tutto e revisionare dopo. Ottieni un mucchio incoerente senza causa.
| Fase | Output | Controllo qualità |
|---|---|---|
| 1. Definizione | scheda identità e anchor prompt | segnali specifici, non vaghi |
| 2. Character bible | ritratto, full body, tre quarti, espressioni | stessa persona negli anchor |
| 3. Spec freeze | modello, size, quality, riferimenti, template | confronti equi |
| 4. Scene planning | un prompt strutturato per scena | una variazione principale |
| 5. Batch | 2-4 candidati per scena | scartare presto drift volto/outfit |
| 6. Riparazione | editare solo l'elemento fallito | ripetere preserve list |
| 7. Review finale | side-by-side con anchor | identità, outfit e beat passano insieme |
Registra ogni immagine accettata:
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Sembra amministrazione, ma evita caos. Se la scena 14 è buona e la 15 drift, devi sapere cosa è cambiato.
Template di prompt adattabili
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Valutazione: non fidarti solo dell'impressione
La review umana serve, ma il gusto vago non basta. Crea un benchmark:
- close-up frontale,
- volto tre quarti,
- full-body standing pose,
- posa seduta,
- corsa,
- low-angle hero shot,
- vista dall'alto,
- notte piovosa,
- notte nevosa,
- variazione outerwear,
- emozione forte,
- conversione stile.
Genera candidati con gli stessi riferimenti e confrontali accanto agli anchor.
| Domanda | Condizione di pass |
|---|---|
| È lo stesso volto? | geometria principale ed età corrispondono |
| Età stabile? | non ringiovanisce o invecchia involontariamente |
| Pelle e indizi etnici stabili? | nessun recasting accidentale |
| Capelli stabili? | attaccatura, lunghezza, texture e silhouette riconoscibili |
| Proporzioni stabili? | altezza, build e arti coerenti |
| Outfit core stabile? | silhouette, palette e accessori restano |
| Scena riuscita? | azione, setting, camera e mood presenti |
I controlli automatici aiutano, ma non decidono. Embedding volto, similarità percettiva e vision-language scoring falliscono con stilizzazione, occlusione, profilo o luci estreme.
Problemi comuni di drift
| Problema | Aspetto | Fix rapido |
|---|---|---|
| Face drift | occhi, mascella, naso o attaccatura non corrispondono | usare face reference, ripetere preserve list, ridurre cambio |
| Outfit drift | cambiano giacca, colori, accessori o silhouette | aggiungere riferimento full-body, separare core outfit e outerwear |
| Lo stile mangia identità | anime/acquerello diventa altra persona | fissare proporzioni facciali e silhouette capelli, convertire dopo |
| Camera drift | angle, crop o prospettiva cambiano | mettere shot size, angle, framing e lens feel in camera block e preserve list |
| Local edit spillover | correggere orecchino cambia capelli o volto | restringere edit, usare mask se disponibile, ripetere change only |
| Over-copying | volto incollato o rigido | usare più angoli, consentire espressione e luce diverse |
| Testo/loghi | lettere casuali, watermark, branding falso | mantenere "no text, no watermark, no logo" |
La maggior parte dei fallimenti nasce dal chiedere troppo cambio insieme. Semplifica, crea un intermedio pulito, poi fai un edit controllato.
Consigli pratici sulle impostazioni
Mantieni impostazioni stabili. Se cambi modello, size, quality, reference set e struttura prompt insieme, non sai quale variabile ha causato drift.
Per gli anchor usa formato ritratto o quadrato; landscape solo quando serve. Separa size di export finale e test d'identità. In bozza genera più candidati; in finale riduci variazione e registra prompt e riferimenti.
Non basare il workflow su controlli non esposti dall'interfaccia GPT Image 2. Se seed, sampling steps o guidance scale non sono disponibili, non fanno parte della ripetibilità. Usa riferimenti, struttura, edit, image IDs o previous responses se disponibili, size stabile, quality stabile e review rigorosa.
Conclusione
La migliore guida GPT Image 2 AI art per coerenza del personaggio non è un prompt segreto. È un workflow disciplinato:
- definire il personaggio prima della storia,
- separare identità e cambio scena,
- dare un compito a ogni reference,
- fare piccoli edit,
- preservare più di quanto cambi,
- registrare ogni run accettato,
- confrontare con gli anchor,
- riparare subito il drift.
Così gli esperimenti prompt-to-art diventano character art, concept art, sviluppo fumetto e sequenze visive pronte per la produzione.

![[it] Advanced Prompt Workflows for Designers in GPT Image 2](https://gpt-image-2.live/blog-assets/f7f88ae7fe45ba37/hero-replicate.webp)
