GPT Image 2 AI Art: prompt-гайд по консистентности персонажей
GPT Image 2 Team
10 мая 2026 г.

Практический GPT Image 2 AI art prompt guide для сохранения узнаваемости персонажа между сценами: identity anchors, reference images, prompt templates, evaluation и troubleshooting.

Консистентность персонажа — одна из самых сложных частей prompt-to-art производства. Одно изображение может выглядеть эффектно, но история, game pitch, concept deck, comic page или серия character art требуют большего: один и тот же человек должен оставаться узнаваемым при смене камеры, света, одежды и эмоции.
Этот гайд для AI art авторов, использующих GPT Image 2-подобные workflows для character art, concept art и покадрового визуального развития. Он не обещает идеальный identity lock. Практическая правда: консистентность — это workflow, а не магический prompt.
Надежный подход — инженерить процесс: character anchor, indexed reference images, layered prompts, маленькие controlled edits, stable settings, version records и review, который ловит drift до того, как он распространяется.
Что на самом деле означает консистентность персонажа

В AI art консистентность не означает одинаковые пиксели. Она означает, что зритель верит: на серии изображений один и тот же персонаж. Узнавание держится на стабильных признаках:
| Слой | Что должно оставаться стабильным | Что можно осторожно менять |
|---|---|---|
| Identity | геометрия лица, возрастной диапазон, тон кожи, ethnic cues, линия волос, длина и текстура, шрамы, татуировки, пропорции тела | выражение, поворот головы, частичная тень, мимическое напряжение |
| Styling | силуэт одежды, core palette, signature accessories, posture language | погодные слои, повреждения, грязь, формальные варианты, сезонный outerwear |
| Scene | локация, свет, погода, камера, поза, композиция, medium | почти все, если это явно объявлено как scene change |
Ошибка — считать все детали равными. Лицо, линия волос, пропорции, силуэт outfit и signature accessories несут идентичность. Фон, камера, свет, поза и погода несут сцену. Если prompt меняет обе группы одновременно, модель теряет приоритет и персонаж дрейфует.
Реалистичная цель: удержать персонажа правдоподобным на 5-50 изображениях, разрешая controlled variation позы, эмоции, framing, света, погоды и scene design. Prompt-only workflow не является биометрической системой.
Начните с character bible
Перед двадцатью сценами создайте character bible — референсный набор, который определяет персонажа до усложнения сюжета.
Минимум:
- Front portrait, нейтральный свет, чистое лицо.
- Full-body standing pose, нейтральный фон, полный outfit.
- Three-quarter view с формой волос, носом, челюстью и profile cues.
- Expression sheet с контролируемыми эмоциями.
Имена файлов должны быть прямыми. Скучная система лучше переживает ревизии:
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
Character bible должна быть ясной, стабильной и полезной. Не используйте в anchors драматический свет, экстремальные углы, motion blur или полускрытые лица.
Layered prompting вместо длинной каши
Длинный prompt не значит хороший prompt. Поддерживаемый prompt разделяет identity, styling, scene, camera, lighting, style и constraints.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
Это не сложно. В этом смысл: понятная иерархия, повторное использование и возможность проверять блоки по отдельности.
Главная инструкция: что сохранить, что изменить
Для edits всегда явно указывайте, что меняется и что остается. Для консистентности это самая полезная привычка.
Слабая версия:
Put the same woman in a snowy city at night.
Сильнее:
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
Вторая версия длиннее, но это не шум. Каждая строка закрывает типичный failure mode: новое лицо, новый outfit, новая камера или измененная identity.
Reference images: у каждой картинки своя задача
Reference images — сильный стабилизатор, но без ролей они конфликтуют. Используйте индекс:
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Повторите роль в prompt:
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Если style reference содержит красивого персонажа, модель может перенять его лицо. Если pose reference с другой одеждой, outfit начнет дрейфовать. Чистый вариант: neutral identity reference, full-body outfit reference, style reference без персонажа, простая composition reference.
Стройте сцены маленькими шагами
Типичная ошибка — менять слишком много:
- тот же персонаж,
- новый outfit,
- новая pose,
- новая camera angle,
- новый lighting,
- новый medium,
- новая location.
Разбейте работу:
- Зафиксировать face и full-body anchor.
- Перенести персонажа в нужный camera angle.
- Изменить pose.
- Изменить environment.
- Добавить weather или lighting.
- Изменить только outerwear или costume variant.
- Менять style только после стабильной identity.
Для anime, watercolor, comic ink и других стилизованных outputs пишите "same facial proportions", "same hairstyle silhouette", "same color palette" и запрещайте делать персонажа моложе.
Production pipeline для 5-50 сцен
Не генерируйте все сцены перед review. Получится куча несогласованных изображений без понятной причины.
| Stage | Output | Quality check |
|---|---|---|
| 1. Character definition | written identity sheet and anchor prompts | cues specific, not vague |
| 2. Character bible | portrait, full body, three-quarter, expression sheet | same person across anchors |
| 3. Spec freeze | model, size, quality, reference set, prompt template | future runs comparable |
| 4. Scene planning | one structured prompt per scene | one primary change |
| 5. Batch generation | 2-4 candidates per scene | reject face/outfit drift early |
| 6. Targeted repair | edit only failed element | repeat preserve list |
| 7. Final review | side-by-side anchor comparison | identity, outfit and story beat pass |
Логируйте каждое принятое изображение:
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Это не бюрократия, а защита от хаоса. Если scene 14 хорошая, а scene 15 уехала, нужно знать, что изменилось.
Prompt templates для адаптации
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Evaluation: не доверяйте только ощущению
Human review нужна, но расплывчатого вкуса мало. Сделайте benchmark:
- front close-up,
- three-quarter face,
- full-body standing pose,
- seated pose,
- running action,
- low-angle hero shot,
- top-down scene,
- rainy night,
- snowy night,
- outfit overlay,
- strong emotion,
- style conversion.
Генерируйте несколько candidates с тем же reference set и сравнивайте рядом с anchor.
| Question | Pass condition |
|---|---|
| Это то же лицо? | major facial geometry и age range совпадают |
| Возраст стабилен? | персонаж не стал моложе или старше без причины |
| Skin tone и ethnicity cues стабильны? | нет accidental identity recast |
| Hairstyle стабильна? | hairline, length, texture и silhouette узнаваемы |
| Body proportions стабильны? | height, build и limb proportions согласованы |
| Core outfit стабилен? | silhouette, palette и signature accessories сохраняются |
| Scene task выполнен? | action, setting, camera и mood присутствуют |
Автоматические проверки — только поддержка. Face embeddings, perceptual similarity и vision-language scoring ошибаются при стилизации, occlusion, profile view и тяжелом lighting.
Частые drift-проблемы
| Problem | Как выглядит | Быстрое исправление |
|---|---|---|
| Face drift | eyes, jaw, nose или hairline больше не совпадают | face reference, preserve list, меньше scene change |
| Outfit drift | jacket, colors, accessories или silhouette меняются | full-body outfit reference, разделить core outfit и outerwear |
| Style eats identity | anime/watercolor стал другим человеком | same facial proportions и same hairstyle silhouette, style позже |
| Camera drift | angle, crop или perspective изменились | shot size, angle, framing, lens feel в camera block и preserve list |
| Local edit spillover | правка серьги меняет hair/face | сузить edit, mask если есть, repeat change only |
| Over-copying | лицо выглядит наклеенным | несколько angles, разрешить expression и lighting variation |
| Text/logos appear | random letters, watermark-like marks, fake branding | держать "no text, no watermark, no logo" |
Большинство failures возникает из-за слишком большого изменения сразу. Упростите, сделайте чистую intermediate version и затем один controlled edit.
Практические советы по settings
Держите settings стабильными. Если одновременно менять model version, image size, quality, reference set и prompt structure, причина drift будет неизвестна.
Для character anchors используйте portrait или square. Landscape — только если сцена требует. Разделяйте final export size и identity testing. Для drafts генерируйте несколько candidates; для finals снижайте variation и логируйте exact prompt и references.
Не строите workflow вокруг controls, которые не exposed в вашем GPT Image 2 interface. Если seed, sampling steps или guidance scale недоступны, они не часть repeatability system. Используйте references, prompt structure, edits, image IDs или previous responses при наличии, stable size, stable quality и строгий review.
Итог
Лучший GPT Image 2 AI art prompt guide для консистентности персонажей — не секретный prompt, а дисциплина:
- определить персонажа до истории,
- отделить identity от scene change,
- дать каждой reference image одну задачу,
- делать small edits,
- preserve писать яснее, чем change,
- логировать каждый accepted run,
- проверять against anchors,
- чинить drift сразу.
Так prompt-to-art эксперименты становятся usable character art, concept art, comic development и production-ready scene sequences.

