GPT Image 2 AI Art Prompt Guide für konsistente Charaktere
GPT Image 2 Team
10. Mai 2026

Praktischer GPT Image 2 AI Art Leitfaden für wiedererkennbare Charaktere über Szenen hinweg, mit Identitätsankern, Referenzbildern, Prompt-Templates, Bewertung und Troubleshooting.

Charakterkonsistenz ist eine der härtesten Aufgaben in der Prompt-to-Art-Produktion. Ein Einzelbild kann beeindruckend sein, aber Story, Game Pitch, Concept Deck, Comicseite oder Character-Art-Serie brauchen mehr: dieselbe Person muss bei anderer Kamera, anderem Licht, anderer Kleidung und anderer Emotion wiedererkennbar bleiben.
Dieser Guide richtet sich an AI-Art-Creator, die GPT Image 2 ähnliche Workflows für Character Art, Concept Art und szenenweise Visual Development nutzen. Er verspricht keinen perfekten Identity Lock. Konsistenz ist ein Workflow, kein Zauberprompt.
Der zuverlässige Weg ist Prozessdisziplin: Charakteranker, indexierte Referenzbilder, geschichtete Prompts, kleine kontrollierte Edits, stabile Settings, Versionslog und Review, das Drift früh erkennt.
Was Charakterkonsistenz wirklich bedeutet

Konsistenz heißt nicht, dass jedes Pixel identisch ist. Sie heißt, dass Betrachter glauben, dieselbe Figur in einer Sequenz zu sehen. Das hängt von stabilen Identitätsmerkmalen ab:
| Ebene | Stabil halten | Vorsichtig änderbar |
|---|---|---|
| Identität | Gesichtsgeometrie, Altersbereich, Hautton, ethnische Hinweise, Haarlinie, Länge und Textur, Narben, Tattoos, Körperproportionen | Ausdruck, Kopfdrehung, Teilschatten, Gesichtsspannung |
| Styling | Kleidungssilhouette, Kernpalette, Signature-Accessoires, Haltungssprache | Wetterschichten, Schmutz, Schaden, formelle Varianten, saisonale Jacken |
| Szene | Ort, Licht, Wetter, Kamera, Pose, Komposition, Medium | fast alles, wenn als Szenenänderung deklariert |
Der Fehler ist, alle Details gleich zu behandeln. Gesicht, Haarlinie, Proportionen, Outfit-Silhouette und Accessoires tragen Identität. Hintergrund, Kamera, Licht, Pose und Wetter tragen Szene. Wenn ein Prompt beide Gruppen stark ändert, weiß das Modell nicht, was Priorität hat.
Ein realistisches Ziel: eine Figur über 5 bis 50 Bilder glaubwürdig halten und kontrollierte Variation in Pose, Emotion, Framing, Licht, Wetter und Szenendesign erlauben. Ein Prompt-only-Workflow ist kein biometrisches System.
Mit einer Character Bible starten
Erstellen Sie vor zwanzig Szenen eine Character Bible. Sie definiert die Figur, bevor die Geschichte komplex wird.
Mindestsatz:
- Frontportrait, neutrales Licht, klares Gesicht.
- Ganzkörperpose, neutraler Hintergrund, vollständiges Outfit.
- Dreiviertelansicht mit Haarform, Nase, Kiefer und Profilhinweisen.
- Expression Sheet unter kontrollierten Emotionen.
Benennen Sie Dateien sachlich. Langweilige Namen überleben Revisionen:
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
Die Bible soll klar, ruhig und nützlich sein. Dramatisches Licht, extreme Winkel, Motion Blur oder halb verdeckte Gesichter machen schlechte Anker.
Layered Prompting statt langer Prompt-Suppe
Lange Prompts sind nicht automatisch besser. Ein wartbarer Prompt trennt Identität, Styling, Szene, Kamera, Licht, Stil und Constraints.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
Das ist nicht fancy. Genau deshalb funktioniert es: klare Hierarchie, wiederverwendbar, leicht zu prüfen.
Die wichtigste Anweisung: bewahren versus ändern
Bei Edits muss klar sein, was sich ändern soll und was gleich bleibt.
Schwach:
Put the same woman in a snowy city at night.
Stärker:
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
Die längere Version ist kein Ballast. Jeder Zusatz verhindert einen typischen Fehler: neues Gesicht, neues Outfit, neue Kamera oder veränderte Identität.
Referenzbilder: jedes Bild bekommt einen Job
Referenzbilder stabilisieren stark, können sich aber gegenseitig stören. Nutzen Sie indizierte Rollen:
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Wiederholen Sie die Rollen im Prompt:
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Eine Stilreferenz mit attraktiver Person kann deren Gesicht übertragen. Eine Pose-Referenz mit anderer Kleidung kann das Outfit verschieben. Am saubersten: neutrale Identitätsreferenz, Ganzkörper-Outfit, möglichst personenfreie Stilreferenz und einfache Komposition.
Szenen in kleinen Schritten bauen
Zu viel auf einmal verursacht Drift:
- gleiche Figur,
- neues Outfit,
- neue Pose,
- neue Kamera,
- neues Licht,
- neues Medium,
- neuer Ort.
Teilen Sie es:
- Gesicht und Ganzkörperanker fixieren.
- Dieselbe Figur in den Zielkamerawinkel bringen.
- Pose ändern.
- Umgebung ändern.
- Wetter oder Licht hinzufügen.
- Nur Outerwear oder Kostümvariante ändern.
- Stil erst konvertieren, wenn Identität stabil ist.
Bei Anime, Aquarell, Comic Ink und stark stilisierten Outputs explizit schreiben: "same facial proportions", "same hairstyle silhouette", "same color palette" und kein Verjüngen.
Produktionspipeline für 5 bis 50 Szenen
Nicht alles generieren und erst danach prüfen. Das erzeugt inkonsistente Stapel ohne Ursache.
| Phase | Output | Qualitätscheck |
|---|---|---|
| 1. Definition | Identity Sheet und Anchor Prompts | konkrete Identitätsmerkmale |
| 2. Character Bible | Portrait, Ganzkörper, Dreiviertel, Expressions | gleiche Person in allen Ankern |
| 3. Spec Freeze | Modell, Größe, Qualität, Referenzen, Template | faire Vergleichbarkeit |
| 4. Szenenplanung | ein strukturierter Prompt pro Szene | eine Hauptänderung pro Szene |
| 5. Batch | 2-4 Kandidaten pro Szene | Face/Outfit Drift früh verwerfen |
| 6. Repair | nur fehlerhaftes Element editieren | preserve list wiederholen |
| 7. Final Review | Side-by-side mit Ankern | Identität, Outfit und Story Beat passen |
Akzeptierte Bilder loggen:
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Diese Verwaltung verhindert Chaos. Wenn Szene 14 gut ist und Szene 15 driftet, müssen Sie wissen, was geändert wurde.
Prompt-Templates zum Anpassen
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Evaluation: nicht nur nach Gefühl prüfen
Menschliche Review ist nötig, aber vages Bauchgefühl reicht nicht. Erstellen und wiederverwenden:
- front close-up,
- three-quarter face,
- full-body standing pose,
- seated pose,
- running action,
- low-angle hero shot,
- top-down scene,
- rainy night,
- snowy night,
- outfit overlay,
- strong emotion,
- style conversion.
Mehrere Kandidaten mit gleichem Referenzset generieren und neben den Ankern prüfen.
| Frage | Bestehensbedingung |
|---|---|
| Ist es dasselbe Gesicht? | Hauptgeometrie und Altersbereich passen |
| Bleibt das Alter stabil? | nicht unbeabsichtigt jünger oder älter |
| Bleiben Hautton und ethnische Hinweise stabil? | kein Identity Recast |
| Bleibt die Frisur stabil? | Haarlinie, Länge, Textur, Silhouette erkennbar |
| Bleiben Proportionen stabil? | Größe, Build und Gliedmaßen konsistent |
| Bleibt das Kernoutfit stabil? | Silhouette, Palette und Accessoires bleiben |
| Gelingt die Szene? | Aktion, Setting, Kamera und Mood vorhanden |
Automatische Checks helfen nur unterstützend. Face Embeddings, perceptual similarity und Vision-Language Scoring können bei Stil, Occlusion, Profilansicht oder starkem Licht falsch liegen.
Häufige Drift-Probleme
| Problem | Wirkung | Schnellste Korrektur |
|---|---|---|
| Face Drift | Augen, Kiefer, Nase oder Haarlinie passen nicht | Gesichtsreferenz nutzen, preserve list wiederholen, Änderung reduzieren |
| Outfit Drift | Jacke, Farben, Accessoires oder Silhouette ändern sich | Ganzkörperreferenz ergänzen, Kernoutfit und Outerwear trennen |
| Stil frisst Identität | Anime/Aquarell wird andere Person | gleiche Gesichtsproportionen und Frisur festschreiben, Stil später konvertieren |
| Camera Drift | Winkel, Crop oder Perspektive wechseln | Shot size, angle, framing und lens feel in Camera Block und preserve list |
| Local edit spillover | Ohrring-Fix ändert Haare oder Gesicht | Edit eingrenzen, ggf. Maske nutzen, change only wiederholen |
| Over-copying | Gesicht wirkt aufgeklebt oder starr | mehrere Winkel nutzen, Ausdruck und Licht variieren lassen |
| Text/Logos erscheinen | Zufallsbuchstaben, Watermark, Fake Branding | "no text, no watermark, no logo" beibehalten |
Meist entsteht Drift durch zu viel Änderung auf einmal. Vereinfachen, Zwischenversion erzeugen, dann einen kontrollierten Edit machen.
Praktische Settings
Halten Sie Settings stabil. Wenn Modellversion, Größe, Qualität, Referenzen und Promptstruktur gleichzeitig wechseln, ist die Ursache von Drift nicht messbar.
Für Anker eignen sich Portrait oder Quadrat; Landscape nur bei Bedarf. Trennen Sie Exportgröße von Identitätstests. Für Drafts mehrere Kandidaten, für Finals weniger Variation und exakte Prompts/Referenzen loggen.
Bauen Sie keinen Workflow um nicht verfügbare GPT Image 2 Controls. Wenn seed, sampling steps oder guidance scale nicht exposed sind, gehören sie nicht zum Repeatability-System. Nutzen Sie Referenzen, Promptstruktur, Edits, image IDs oder previous responses wenn verfügbar, stabile Größe, stabile Qualität und harte Review.
Fazit
Der beste GPT Image 2 AI Art Prompt Guide für Charakterkonsistenz ist kein geheimer Prompt, sondern ein disziplinierter Workflow:
- Figur vor Story definieren,
- Identität von Szenenänderung trennen,
- jeder Referenz einen Job geben,
- kleine Edits machen,
- mehr bewahren als ändern,
- akzeptierte Runs loggen,
- gegen Anker prüfen,
- Drift sofort reparieren.
So werden Prompt-to-Art-Experimente zu nutzbarer Character Art, Concept Art, Comic Development und produktionsreifen Szenensequenzen.

![[de] Advanced Prompt Workflows for Designers in GPT Image 2](https://gpt-image-2.live/blog-assets/f7f88ae7fe45ba37/hero-replicate.webp)
