Guia de prompts GPT Image 2 AI Art para consistência de personagens
GPT Image 2 Team
10 de maio de 2026

Guia prático de GPT Image 2 AI art para manter personagens reconhecíveis entre cenas com âncoras de identidade, imagens de referência, templates de prompt, avaliação e solução de problemas.

Consistência de personagem é uma das partes mais difíceis da produção prompt-to-art. Uma imagem única pode impressionar, mas uma história, pitch de jogo, deck conceitual, página de quadrinhos ou série de character art exige mais: a mesma pessoa precisa continuar reconhecível quando câmera, luz, roupa e emoção mudam.
Este guia é para criadores de AI art que usam workflows no estilo GPT Image 2 para character art, concept art e desenvolvimento visual por cena. Ele não promete um bloqueio perfeito de identidade. A verdade prática é que consistência é workflow, não magia.
O caminho confiável é estruturar o processo: âncora de personagem, referências indexadas, prompts em camadas, pequenas edições controladas, configurações estáveis, registros de versão e revisão que pega drift cedo.
O que consistência de personagem realmente significa

Em AI art, consistência não significa pixels idênticos. Significa que o público acredita estar vendo o mesmo personagem numa sequência. Esse reconhecimento depende de sinais estáveis:
| Camada | O que deve ficar estável | O que pode mudar com cuidado |
|---|---|---|
| Identidade | geometria facial, faixa etária, tom de pele, pistas étnicas, linha do cabelo, comprimento e textura, cicatrizes, tatuagens, proporções | expressão, giro de cabeça, sombra parcial, tensão facial |
| Styling | silhueta da roupa, paleta base, acessórios assinatura, postura | camadas de clima, dano, sujeira, variantes formais, outerwear sazonal |
| Cena | local, luz, clima, câmera, pose, composição, meio | quase tudo, desde que declarado como mudança de cena |
O erro é tratar todos os detalhes como iguais. Rosto, linha do cabelo, proporções, silhueta de roupa e acessórios carregam identidade. Fundo, câmera, luz, pose e clima carregam cena. Se o prompt muda os dois grupos, o modelo perde prioridade e o personagem deriva.
Meta realista: manter um personagem crível em 5 a 50 imagens, permitindo variação controlada de pose, emoção, enquadramento, luz, clima e cena. Um workflow só de prompt não é sistema biométrico.
Comece com uma character bible
Antes de pedir vinte cenas, crie uma character bible: o conjunto de referência que define o personagem antes da história complicar.
Mínimo útil:
- Retrato frontal, luz neutra, rosto claro.
- Corpo inteiro, fundo neutro, roupa completa.
- Três quartos, mostrando cabelo, nariz, mandíbula e perfil.
- Folha de expressões em condições controladas.
Use nomes simples. Naming chato sobrevive a revisões:
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
A bible deve ser clara, estável e útil. Evite luz dramática, ângulos extremos, motion blur ou rostos escondidos nos anchors.
Use prompts em camadas, não sopa de texto
Prompts longos não são automaticamente melhores. Um prompt sustentável separa identidade, styling, cena, câmera, luz, estilo e restrições.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
Não é sofisticado. Esse é o valor: hierarquia clara, reutilização e debug por bloco.
A instrução mais importante: preservar versus mudar
Em edições, diga exatamente o que muda e o que permanece. Para consistência, isso vale mais que adjetivos.
Fraco:
Put the same woman in a snowy city at night.
Mais forte:
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
A segunda versão não é excesso. Cada frase reduz um erro comum: novo rosto, nova roupa, nova câmera ou identidade alterada.
Imagens de referência: dê uma função para cada uma
Referências estabilizam, mas podem brigar. Use papéis indexados:
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Repita os papéis no prompt:
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Uma referência de estilo com personagem bonito pode emprestar o rosto errado. Uma pose reference com outra roupa pode alterar o outfit. Melhor: referência de identidade neutra, roupa de corpo inteiro, estilo sem personagem quando possível e composição simples.
Construa cenas em pequenos passos
Mudar dimensões demais de uma vez quebra a identidade:
- mesmo personagem,
- roupa nova,
- pose nova,
- câmera nova,
- luz nova,
- meio novo,
- local novo.
Divida:
- Trave rosto e corpo inteiro.
- Coloque o mesmo personagem no ângulo de câmera alvo.
- Mude a pose.
- Mude o ambiente.
- Adicione clima ou luz.
- Mude só outerwear ou variante de roupa.
- Converta estilo só depois de estabilizar identidade.
Para anime, aquarela, comic ink e estilos fortes, escreva "same facial proportions", "same hairstyle silhouette", "same color palette" e impeça rejuvenescimento.
Pipeline para 5 a 50 cenas
Não gere tudo para revisar depois. Isso cria uma pilha inconsistente sem causa clara.
| Etapa | Saída | Checagem |
|---|---|---|
| 1. Definição | ficha de identidade e anchor prompts | sinais concretos |
| 2. Character bible | retrato, corpo, três quartos, expressões | mesma pessoa nos anchors |
| 3. Spec freeze | modelo, tamanho, qualidade, referências, template | comparação justa |
| 4. Planejamento | um prompt estruturado por cena | uma mudança principal |
| 5. Batch | 2 a 4 candidatos por cena | rejeitar drift cedo |
| 6. Reparo | editar só o elemento que falhou | repetir preserve list |
| 7. Review final | comparar lado a lado com anchors | identidade, roupa e beat passam juntos |
Registre toda imagem aprovada:
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Isso evita caos. Se a cena 14 está boa e a 15 deriva, você precisa saber o que mudou.
Templates de prompt para adaptar
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Avaliação: não confie só no feeling
Revisão humana é necessária, mas gosto vago não basta. Crie um benchmark:
- close-up frontal,
- rosto três quartos,
- corpo inteiro,
- sentado,
- correndo,
- low-angle hero shot,
- vista de cima,
- noite chuvosa,
- noite nevada,
- mudança de outerwear,
- emoção forte,
- conversão de estilo.
Gere candidatos com as mesmas referências e revise ao lado dos anchors.
| Pergunta | Condição de aprovação |
|---|---|
| É o mesmo rosto? | geometria principal e idade batem |
| Idade estável? | não ficou mais jovem ou velho sem intenção |
| Pele e pistas étnicas estáveis? | sem recasting acidental |
| Cabelo estável? | linha, comprimento, textura e silhueta reconhecíveis |
| Proporções estáveis? | altura, corpo e membros coerentes |
| Outfit principal estável? | silhueta, paleta e acessórios permanecem |
| Cena cumprida? | ação, ambiente, câmera e mood presentes |
Checks automáticos ajudam, mas não decidem. Face embeddings, similaridade perceptual e vision-language scoring falham com estilização, oclusão, perfil ou luz pesada.
Problemas comuns de drift
| Problema | Aparência | Correção rápida |
|---|---|---|
| Face drift | olhos, mandíbula, nariz ou cabelo não batem | usar referência de rosto, repetir preserve list, reduzir mudança |
| Outfit drift | jaqueta, cores, acessórios ou silhueta mudam | adicionar referência full-body, separar outfit base e outerwear |
| Estilo come identidade | anime/aquarela vira outra pessoa | fixar proporções faciais e cabelo, converter estilo depois |
| Camera drift | ângulo, crop ou perspectiva mudam | colocar shot size, angle, framing e lens feel no camera block e preserve list |
| Spillover local | corrigir brinco muda cabelo ou rosto | limitar edição, usar máscara se houver, repetir change only |
| Cópia excessiva | rosto colado ou rígido | usar múltiplos ângulos, permitir expressão e luz diferentes |
| Texto/logos | letras aleatórias, watermark, fake branding | manter "no text, no watermark, no logo" |
A maioria dos erros vem de pedir mudanças demais. Simplifique, gere um intermediário limpo e faça uma edição controlada.
Conselhos práticos de configuração
Mantenha configurações estáveis. Se mudar modelo, tamanho, qualidade, referências e prompt ao mesmo tempo, não saberá o que causou drift.
Para anchors, use retrato ou quadrado; landscape só quando a cena pedir. Separe tamanho final de export e teste de identidade. Para rascunhos, gere vários candidatos; para finais, reduza variação e registre prompt e referências.
Não baseie o workflow em controles não expostos na interface GPT Image 2. Se seed, sampling steps ou guidance scale não existem, não fazem parte da repetibilidade. Use referências, estrutura, edições, image IDs ou previous responses quando disponíveis, tamanho estável, qualidade estável e revisão rígida.
Conclusão
O melhor guia GPT Image 2 AI art para consistência de personagem não é um prompt secreto. É um workflow disciplinado:
- definir o personagem antes da história,
- separar identidade e mudança de cena,
- dar um trabalho para cada referência,
- fazer edições pequenas,
- preservar mais do que mudar,
- registrar cada run aceito,
- revisar contra anchors,
- corrigir drift imediatamente.
É assim que experimentos prompt-to-art viram character art, concept art, desenvolvimento de quadrinhos e sequências visuais prontas para produção.

![[pt] Advanced Prompt Workflows for Designers in GPT Image 2](https://gpt-image-2.live/blog-assets/f7f88ae7fe45ba37/hero-replicate.webp)
