Guía de prompts GPT Image 2 AI Art para mantener personajes consistentes
GPT Image 2 Team
10 de mayo de 2026

Guía práctica de GPT Image 2 AI art para mantener personajes reconocibles entre escenas con anclas de identidad, imágenes de referencia, plantillas de prompt, evaluación y resolución de problemas.

La consistencia de personajes es una de las partes más difíciles de la producción prompt-to-art. Una imagen aislada puede impresionar, pero una historia, un pitch de videojuego, un deck conceptual, una página de cómic o una serie de character art necesitan algo más estricto: la misma persona debe seguir siendo reconocible aunque cambien cámara, luz, ropa y emoción.
Esta guía es para creadores de AI art que usan workflows tipo GPT Image 2 en character art, concept art y desarrollo visual escena por escena. No promete un bloqueo perfecto de identidad. La verdad práctica es que la consistencia es un workflow, no magia.
El método fiable es diseñar el proceso: ancla de personaje, imágenes de referencia indexadas, prompts por capas, ediciones pequeñas, ajustes estables, registros de versión y una revisión que detecte drift antes de que contamine todo el proyecto.
Qué significa realmente la consistencia de personaje

En AI art, consistencia no significa que todos los píxeles sean idénticos. Significa que el espectador cree que las imágenes muestran el mismo personaje. Ese reconocimiento depende de señales estables:
| Capa | Qué debe mantenerse estable | Qué puede cambiar con cuidado |
|---|---|---|
| Identidad | geometría facial, rango de edad, tono de piel, señales étnicas, línea del pelo, largo y textura, cicatrices, tatuajes, proporciones | expresión, giro de cabeza, sombra parcial, tensión facial |
| Estilo/ropa | silueta de ropa, paleta base, accesorios firma, lenguaje postural | capas de clima, daño, suciedad, variantes formales, abrigo estacional |
| Escena | lugar, luz, clima, cámara, pose, composición, medio | casi todo, si se declara como cambio de escena |
El error es tratar todos los detalles igual. Rostro, línea del pelo, proporciones, silueta de outfit y accesorios llevan la identidad. Fondo, cámara, luz, pose y clima llevan la escena. Si el prompt cambia ambos grupos a la vez, el modelo no sabe qué priorizar y el personaje deriva.
Objetivo realista: mantener un personaje creíble en 5 a 50 imágenes, permitiendo variación controlada de pose, emoción, encuadre, luz, clima y escena. No esperes que un workflow solo de prompt actúe como sistema biométrico.
Empieza con una biblia de personaje
Antes de pedir veinte escenas, crea una character bible: el set de referencia que define al personaje antes de complicar la historia.
Mínimo útil:
- Retrato frontal, luz neutra, rostro claro.
- Cuerpo completo, fondo neutro, outfit completo.
- Vista tres cuartos, con forma de pelo, nariz, mandíbula y perfil.
- Hoja de expresiones con emociones controladas.
Usa nombres simples. Un sistema aburrido sobrevive mejor a revisiones:
CHAR_A/
bible/
CHAR_A_face_front_v01.png
CHAR_A_fullbody_v01.png
CHAR_A_threequarter_v01.png
CHAR_A_expressions_v01.png
outfits/
CHAR_A_outfit_core_v01.png
CHAR_A_outfit_winter_v02.png
scenes/
SCN_001_rooftop_dusk_v01.json
SCN_014_rain_alley_low_angle_v03.json
La biblia debe ser clara, estable y útil. Evita luz dramática, ángulos extremos, motion blur o rostros medio ocultos en las anclas.
Usa prompting por capas, no una sopa de frases
Los prompts largos no son mejores por sí mismos. Un prompt mantenible separa identidad, styling, escena, cámara, iluminación y restricciones.
Task:
Create a new scene featuring the same recurring character.
Character anchor:
ID: <CHAR_ID>
Age range: <AGE_RANGE>
Skin tone and ethnicity cues: <SKIN_AND_ETHNICITY>
Face: <FACE_GEOMETRY>
Hair: <HAIRLINE_LENGTH_TEXTURE_PARTING>
Marks: <SCARS_TATTOOS_PLACEMENT>
Body proportions: <BODY_PROPORTIONS>
Core outfit: <OUTFIT_SILHOUETTE_COLORS>
Signature accessories: <ACCESSORIES>
Posture language: <POSTURE_LANGUAGE>
Scene:
<LOCATION_ACTION_STORY_BEAT>
Camera:
<SHOT_SIZE>, <ANGLE>, <FRAMING>, <LENS_FEEL>
Lighting:
<LIGHT_SOURCE>, <TIME_OF_DAY>, <WEATHER>, <COLOR_TEMPERATURE>
Style:
<ART_STYLE_OR_PHOTOREALISTIC_LOOK>
Preserve:
same identity, same face geometry, same hairline, same body proportions,
same core outfit silhouette, same signature accessories, same age range
Change only:
<CONTROLLED_SCENE_DELTA>
Exclude:
no extra characters, no extra jewelry, no text, no watermark, no logos,
do not change age, skin tone, ethnicity cues, or facial structure
No es sofisticado, y ese es el punto. Da jerarquía, se reutiliza y permite depurar por bloques.
La instrucción más importante: conservar versus cambiar
En edición, di explícitamente qué cambia y qué permanece. Para consistencia, este hábito vale más que adjetivos de estilo.
Débil:
Put the same woman in a snowy city at night.
Más fuerte:
Change only the environment from a clear dusk rooftop to a snowy city street at night.
Keep the same character, same face geometry, same hairline, same body proportions,
same core outfit, same silver ear cuff, same camera angle, and same framing.
Only update the lighting, snowfall, wet pavement, and background architecture.
No extra text, no watermark, no logo.
La segunda versión no es relleno. Cada frase cierra un fallo frecuente: rostro nuevo, outfit nuevo, cámara nueva o identidad cambiada.
Imágenes de referencia: asigna un trabajo a cada una
Las referencias estabilizan, pero pueden pelearse. Indexa sus roles:
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit silhouette.
Image 3: style reference only, do not copy the person from Image 3.
Image 4: scene sketch or composition reference, optional.
Repite los roles dentro del prompt:
Use Image 1 only to preserve the character's face, hairline, and hair texture.
Use Image 2 to preserve body proportions, outfit silhouette, color palette, and accessories.
Use Image 3 only for brushwork, color mood, and rendering style.
Do not borrow identity, clothing, or facial details from Image 3.
Use Image 4 only for composition and camera placement.
Si una referencia de estilo trae un personaje atractivo, el modelo puede copiar su cara. Si la referencia de pose lleva otra ropa, el outfit puede derivar. Lo más limpio: identidad neutra, outfit de cuerpo completo, estilo sin persona si se puede y composición simple.
Construye escenas en pasos pequeños
Cambiar demasiadas dimensiones a la vez rompe identidad:
- mismo personaje,
- ropa nueva,
- pose nueva,
- cámara nueva,
- luz nueva,
- medio nuevo,
- lugar nuevo.
Divide el trabajo:
- Bloquea cara y cuerpo completo.
- Lleva el mismo personaje al ángulo de cámara objetivo.
- Cambia la pose.
- Cambia el entorno.
- Añade clima o iluminación.
- Cambia solo abrigo o variante de vestuario.
- Convierte estilo solo cuando la identidad sea estable.
En anime, acuarela, tinta de cómic y estilos fuertes, escribe "same facial proportions", "same hairstyle silhouette", "same color palette" y evita que el personaje se haga más joven.
Pipeline de producción para 5 a 50 escenas
No generes todo y revises al final. Eso crea un montón inconsistente sin causa clara.
| Etapa | Salida | Control de calidad |
|---|---|---|
| 1. Definición | ficha de identidad y prompts ancla | señales concretas, no vagas |
| 2. Biblia | retrato, cuerpo, tres cuartos, expresiones | misma persona en todas |
| 3. Spec freeze | modelo, tamaño, calidad, referencias, template | comparación justa |
| 4. Plan escenas | un prompt estructurado por escena | un cambio principal por escena |
| 5. Batch | 2 a 4 candidatos por escena | descartar drift de cara/ropa pronto |
| 6. Reparación | editar solo el elemento fallido | repetir preserve list |
| 7. Revisión final | comparar con anclas lado a lado | identidad, outfit y beat pasan juntos |
Registra cada imagen aceptada:
character_id
scene_id
model_or_snapshot
size
quality
prompt_version
final_prompt
revised_prompt_if_available
reference_image_ids_or_filenames
previous_response_or_image_id_if_used
accepted_output_filename
review_notes
Sin registros, solo estás adivinando por qué la escena 15 derivó después de una escena 14 buena.
Plantillas de prompt adaptables
Template 1: Character Anchor From Scratch
Task:
Create a clean character anchor for a recurring AI art series.
Character:
ID: CHAR_A
Age range: late 20s
Skin tone and ethnicity cues: warm medium skin tone, mixed East Asian and Latin features
Face: oval face, defined cheekbones, straight nose bridge, slightly sharp jawline
Hair: black shoulder-length wavy hair, center part, clean visible hairline
Marks: small diagonal scar at the outer end of the left eyebrow
Body: lean athletic build, medium height, narrow shoulders, long legs
Core outfit: cropped charcoal utility jacket, white ribbed shirt, high-waisted black cargo pants
Accessories: single silver ear cuff on left ear, thin black wristband
Palette: charcoal, black, white, muted teal accent
Posture: alert, grounded, slightly guarded
Scene:
plain warm gray studio background, full body visible, standing naturally
Camera:
full body, eye-level, centered, natural 50mm portrait feel
Lighting:
soft studio light, neutral color temperature, clear face visibility
Style:
high-detail character concept art, clean realistic rendering
Preserve:
same face geometry, same hairline, same body proportions, same outfit silhouette,
same scar, same silver ear cuff, same wristband
Exclude:
no extra characters, no text, no watermark, no logo, no dramatic shadow across the face
Template 2: New Scene With Reference Images
Task:
Create a new scene with the same recurring character.
Reference image roles:
Image 1: face and hair identity anchor.
Image 2: full-body proportions and core outfit anchor.
Image 3: rainy neon color mood only, do not copy any person from Image 3.
Scene:
the character runs through a narrow neon alley during heavy rain,
wet pavement reflecting magenta and green signs
Camera:
wide full-body shot, low angle, dynamic motion, 24mm cinematic feel
Lighting:
neon reflections, sodium street light from the rear, cool rain haze
Style:
photorealistic cinematic concept art
Preserve:
same identity as Image 1, same face geometry, same hairline, same scar,
same body proportions from Image 2, same core outfit silhouette,
same silver ear cuff and wristband
Change only:
pose becomes running, jacket surface becomes wet, environment becomes rainy neon alley
Exclude:
no umbrella, no hat, no extra jewelry, no extra text, no watermark, no logo
Template 3: Style Conversion Without Losing Identity
Task:
Convert the existing character scene into a black-and-white comic ink style.
Preserve:
same character identity, same facial proportions, same hairstyle silhouette,
same scar location, same body proportions, same outfit silhouette,
same camera angle, same framing, same pose
Change only:
rendering medium changes to black-and-white comic ink,
with bold shadows, clean linework, and high contrast rain reflections
Exclude:
do not make the character younger, do not enlarge the eyes,
do not change hair length, do not remove the eyebrow scar,
no text, no watermark, no logo
Evaluación: no confíes solo en la intuición
La revisión humana es necesaria, pero el gusto vago no basta. Crea un benchmark y repítelo:
- close-up frontal,
- cara tres cuartos,
- cuerpo completo,
- sentado,
- corriendo,
- low-angle hero shot,
- vista superior,
- noche lluviosa,
- noche nevada,
- cambio de abrigo,
- emoción fuerte,
- conversión de estilo.
Genera varios candidatos con las mismas referencias y míralos junto al ancla.
| Pregunta | Condición de aprobado |
|---|---|
| ¿Es la misma cara? | geometría principal y edad coinciden |
| ¿La edad es estable? | no rejuvenece ni envejece sin intención |
| ¿Piel y señales étnicas estables? | no hay recasting accidental |
| ¿Peinado estable? | línea, largo, textura y silueta reconocibles |
| ¿Proporciones estables? | altura, complexión y extremidades coherentes |
| ¿Outfit central estable? | silueta, paleta y accesorios sobreviven |
| ¿La escena funciona? | acción, entorno, cámara y mood están presentes |
Los checks automáticos ayudan, pero no deciden. Embeddings faciales, similitud perceptual y scoring visión-lenguaje fallan con estilización, oclusión, perfil o luces duras.
Problemas comunes de drift
| Problema | Cómo se ve | Arreglo rápido |
|---|---|---|
| Drift facial | ojos, mandíbula, nariz o línea del pelo ya no coinciden | usar referencia de cara, repetir preserve list, reducir cambio |
| Drift de outfit | cambian chaqueta, colores, accesorios o silueta | añadir referencia cuerpo completo, separar outfit base y abrigo |
| El estilo come identidad | anime o acuarela parece otra persona | fijar mismas proporciones faciales y silueta de pelo, convertir estilo después |
| Drift de cámara | cambia ángulo, crop o perspectiva | poner shot size, angle, framing y lens feel en camera block y preserve list |
| Spillover local | arreglar un pendiente cambia pelo o rostro | acotar edición, usar máscara si existe, repetir change only |
| Sobre-copia | cara pegada o rígida | usar varios ángulos, permitir expresión y luz distintas |
| Texto/logos | letras aleatorias, marcas de agua, branding falso | mantener "no text, no watermark, no logo" |
La mayoría de fallos vienen de pedir demasiado cambio. Simplifica, genera un intermedio limpio y edita una cosa.
Consejos prácticos de ajustes
Mantén ajustes estables. Si cambias modelo, tamaño, calidad, referencias y estructura a la vez, no podrás saber qué causó el drift.
Para anclas usa retrato o cuadrado; paisaje solo si la escena lo necesita. Separa tamaño final de exportación y prueba de identidad. En borradores genera varios candidatos; en finales reduce variación y registra prompt y referencias exactos.
No construyas el workflow sobre controles no expuestos en tu interfaz GPT Image 2. Si seed, sampling steps o guidance scale no existen, no son parte de tu repetibilidad. Usa referencias, estructura de prompt, ediciones, image IDs o previous responses si están disponibles, tamaño estable, calidad estable y revisión estricta.
Conclusión
La mejor guía de prompts GPT Image 2 AI art para consistencia no es un prompt secreto. Es un workflow disciplinado:
- definir el personaje antes de la historia,
- separar identidad y cambio de escena,
- dar un trabajo a cada referencia,
- hacer ediciones pequeñas,
- conservar más de lo que cambias,
- registrar cada run aceptado,
- revisar contra anclas,
- reparar drift de inmediato.
Así los experimentos prompt-to-art se convierten en character art, concept art, desarrollo de cómic y secuencias visuales listas para producción.

![[es] Advanced Prompt Workflows for Designers in GPT Image 2](https://gpt-image-2.live/blog-assets/f7f88ae7fe45ba37/hero-replicate.webp)
