Offre de lancement 2026
Annuel : jusqu'à 50% de réduction
00:00:00.00
Profiter de l'offre
GPT Image 2 AI Art logoGPT Image 2 AI Art
Bonnes pratiques

Si les mots d''invite sont écrits correctement, les mots de l''IA seront à moitié corrects : combat pratique de l''ingénierie des mots d''invite de rendu de texte

A

AI 测评室

4 mai 2026

7 min read
Si les mots d''invite sont écrits correctement, les mots de l''IA seront à moitié corrects : combat pratique de l''ingénierie des mots d''invite de rendu de texte

Le même modèle, la même exigence, mais les mots d'invite sont écrits

Le même modèle, la même exigence, mais les mots d'invite sont écrits de différentes manières, la précision du texte peut être trois fois pire.


Le mot d'ordre n'est pas métaphysique, mais ingénierie

La façon dont de nombreuses personnes écrivent les mots d'invite d'image de l'IA consiste à « écrire tout ce qui leur vient à l'esprit », puis à constater que le texte fait toujours des erreurs et qu'ils estiment que « le modèle n'est pas bon ». Mais avec le même modèle et les mêmes exigences, la précision du texte de certaines personnes peut atteindre 80 %, tandis que d'autres ne peuvent en avoir que 20 % - la différence réside dans la manière dont les mots d'invite sont écrits.

Le mot d'ordre du projet n'est pas « d'écrire une longue description », mais de décrire clairement les quatre dimensions du contenu du texte, du style des glyphes, des contraintes géométriques et des éléments invariants. Ce dont le modèle a besoin, ce ne sont pas vos points d'exclamation et vos adjectifs, mais des instructions précises.

Cet article vous donnera un ensemble de bibliothèques de modèles Word d'invite qui peuvent être directement réutilisées, couvrant les trois plates-formes principales de Stable Diffusion, OpenAI GPT Image 2 et Midjourney. Ils sont classés en trois scénarios : affiches, étiquettes et infographies. Chaque modèle est livré avec des descriptions de paramètres et des guides sur les pièges.

提示词工程效果对比

Structure à quatre niveaux de mots d'invite

Quel que soit le modèle utilisé, les mots d'invite pour le rendu du texte doivent contenir quatre couches d'informations :

Première couche : contenu du texte. Texte spécifique qui doit apparaître à l'écran. Mettez-le entre guillemets pour indiquer explicitement au modèle "ces mots doivent être rendus exactement".

Le deuxième calque : style glyphe. Type de police (serif/sans serif), épaisseur de police (gras/régulier), niveau de taille de police. Écrire « Police chinoise sans empattement moderne, titre en gras » est plus efficace que d'écrire « Utiliser Siyuan Heibo » - le modèle ne connaît pas nécessairement le nom de la police spécifique, mais il peut comprendre la description du style.

Niveau 3 : Contraintes géométriques. La position, la taille, l'alignement et l'espacement des lignes du texte. Plus le modèle est précis, moins il est susceptible de prendre ses propres décisions.

Niveau 4 : Éléments invariants. Ce qui ne peut pas être modifié : texture d'arrière-plan, lumière et ombre, corps du produit, relation de perspective. Utilisez des contraintes comme preserve, do not change, maintain.

Décomposer ces quatre couches et les écrire est bien plus efficace que de regrouper toutes les informations dans une longue phrase.


Plate-forme 1 : mots d'invite d'inpainting à diffusion stable

L'inpainting de Stable Diffusion est l'une des solutions les plus flexibles pour la modification de caractères locaux. Ses mots d'invite sont divisés en deux parties : positives et négatives.

Modèle Word d'invite positive

replace only the masked text with crisp [字体风格] text '[目标文字]',
exact baseline alignment, preserve poster texture, lighting, shadows, perspective

Modèle Word d'invite négative

garbled text, duplicate letters, extra glyphs, warped text, blur, low contrast, artifacts

Paramètres clés

ParamètresValeurs recommandéesDescriptif
🚫EN LIGNE17🚫0,25-0,45Plus la valeur est faible, plus elle est conservatrice, conservant davantage d'informations sur l'image originale. 0,25 convient pour modifier uniquement le texte sans modifier l'arrière-plan, 0,45 convient pour affiner la zone environnante
🚫EN LIGNE18🚫4-7Plus la valeur est élevée, plus les mots rapides seront suivis, mais une valeur trop élevée entraînera une netteté excessive
🚫EN LIGNE19🚫28-40Plus il y a d'étapes, meilleure est la qualité, mais plus la vitesse est lente

Modèle de titre d'affiche

正向:replace masked headline with bold white sans-serif text 'SUMMER SALE',
crisp sharp edges, exact horizontal alignment, preserve gradient background and shadows

负向:garbled text, misspelled words, duplicate letters, warped baseline, blur, extra characters

Paramètres : strength=0.30, guidance_scale=5.5, steps=32

Modèle de nom de marque

正向:replace masked text with clean logo-style text 'NATURA',
letter-spacing uniform, preserve brand color scheme and background texture

负向:garbled text, wrong font weight, uneven spacing, artifacts, low resolution

Paramètres : strength=0.25, guidance_scale=6.0, steps=36

Suggestions de masquage

  • Titre de l'affiche : masque rectangulaire au niveau du mot, s'étendant vers l'extérieur de 2 à 6 px.
  • Nom de la marque : masque rectangulaire global, y compris l'espace blanc environnant
  • Numéros de prix : masque rectangulaire exact, pas d'expansion - l'arrière-plan de la zone numérique est généralement très simple et l'expansion introduit du bruit

Plateforme 2 : mots d'invite du flux d'édition OpenAI GPT Image 2

Mask 编辑工作流

Le flux d'édition de GPT Image 2 implémente la modification locale via le paramètre masque. Le mot d'invite doit décrire « uniquement ce qu'il faut changer et ce qu'il faut conserver » en langage naturel.

Syntaxe de base

from openai import OpenAI
client = OpenAI()

result = client.images.edit(
    model="gpt-image-2",
    image=open("poster.png", "rb"),
    mask=open("mask.png", "rb"),   # 与原图同尺寸、同格式,带 alpha 通道
    prompt='Replace only the masked headline with crisp white sans-serif text "OPEN STUDIO". Preserve perspective, paper texture, and shadows.'
)

Exigences du fichier de masque

  • Même taille que l'image originale (cohérente au niveau des pixels)
  • Même format que l'image originale (PNG ou JPEG)
  • Avec canal alpha (zones transparentes = non modifiées, zones opaques = à modifier)
  • Rappel de la page d'aide officielle de ChatGPT Images : la mise en surbrillance de la sélection n'est pas toujours précise et les modifications peuvent dépasser la zone sélectionnée - laissez donc des marges appropriées dans la zone du masque

Modèle de lettrage d'affiche

Replace only the masked headline with clean white sans-serif text "SUMMER SALE".
Text must be crisp, sharp, with uniform letter spacing.
Preserve poster background, gradient, shadows, and all unmasked elements.
Do not add extra text, watermarks, or decorative elements.

Modèle de modification d'étiquette

Replace only the masked text area with clean product label text "Ingredients: Water, Glycerin, Niacinamide".
Font: small, precise, uniform sans-serif. Match existing label style.
Preserve bottle shape, label material texture, and all surrounding elements.
Do not change product name, logo, or barcode.

Modèle d'affiche chinoise

请只替换蒙版区域的文字为清晰的中文无衬线字体"新消费品牌增长论坛"。
文字必须笔画完整、大小均匀、行距一致。
保持海报背景、光影、透视和所有未蒙版元素不变。
不要添加额外文字、装饰或水印。

Conseils clés

Astuce 1 : placez le texte cible entre guillemets. "SUMMER SALE" est meilleur que SUMMER SALE pour que le modèle comprenne que c'est ce qui doit être représenté avec précision.

Astuce 2 : Dites clairement « changez uniquement la zone masquée ». Replace only the masked area est beaucoup plus précis que Fix the text - le premier limite la portée des modifications, tandis que le second peut amener le modèle à restituer l'image entière.

Astuce 3 : Répertoriez les éléments qui ne peuvent pas être modifiés. Preserve background, shadows, perspective, all unmasked elements - Cette contrainte peut réduire considérablement la situation de "changer un mot, le fond change aussi".

Astuce 4 : ajoutez la contrainte « ne pas réécrire » à la scène chinoise. 文字必须严格按以下内容排版,不要改写、不要增删、不要替换同义词 - Ceci est crucial pour les affiches commerciales qui nécessitent un examen juridique.


Plateforme 3 : invites de modification partielle des mots à mi-parcours

Les fonctionnalités de Midjourney Editor et Vary Region prennent en charge le redessinage de la sélection. Les responsables recommandent que les invites soient courtes et directes, avec des paramètres placés à la fin.

Syntaxe de base

clean swiss poster headline::2 geometric background::1 exact text OPEN STUDIO crisp sans serif aligned baseline --ar 2:3 --raw

Système de poids

Midjourney utilise :: pour séparer les différentes parties du mot d'invite, et le nombre suivant est le poids. Pour le rendu du texte, définissez un poids élevé pour le contenu du texte :

exact text "SUMMER SALE"::3 clean poster design::1 minimalist background::1 --ar 16:9 --raw

::3 signifie que le poids du contenu du texte est 3 fois supérieur à celui des autres parties, et le modèle travaillera plus dur pour écrire les mots correctement.

Modèle de titre d'affiche

clean bold sans-serif headline text "SUMMER SALE"::3 geometric gradient poster background::1 exact baseline alignment sharp crisp edges --ar 16:9 --raw

Modèle d'identité de marque

logo text "NATURA"::3 clean minimalist brand identity::1 letter-spacing uniform professional typography --ar 1:1 --raw

Limites du parcours à mi-parcours

La force de Midjourney réside dans le style visuel et non dans la précision textuelle. Moins de contrôle sur les textes longs (plus de 5 mots) et un crénage précis que Stable Diffusion et GPT Image 2. Ses meilleures utilisations sont : Mots courts stylisés, titres d'affiches conceptuelles, itération rapide des noms de marque.


Compétences générales multiplateformes

Quel que soit le modèle utilisé, les conseils suivants peuvent améliorer la précision du rendu du texte :

Mettez le texte cible entre guillemets

Mettez le texte qui doit apparaître dans l'image entre guillemets, et le modèle le traitera comme un contenu qui « doit être présenté avec précision » plutôt que comme une description qui « peut être lue librement ». Cette astuce fonctionne sur toutes les plateformes.

Déclarer explicitement l'emplacement

Ne vous contentez pas d'écrire « mettre le titre en haut », écrivez « placer le titre principal centré dans les 20 % supérieurs de l'écran, avec la plus grande taille de police ». Plus le modèle est précis, moins il est susceptible de prendre ses propres décisions.

Spécifiez le style de police au lieu du nom de la police

Écrire « Police moderne sans empattement, titres en gras » est plus efficace que « Utiliser Helvetica ». Le modèle ne connaît pas nécessairement le nom de la police spécifique, mais il peut comprendre la description du style.

Contrôler la quantité de texte

Travaillez sur seulement 1 à 3 mots ou phrases à la fois. Plus il y a de mots, plus le risque d’erreur est élevé. Si vous devez modifier plusieurs zones de texte, faites-le plusieurs fois, une zone à la fois.

Effacez d'abord, puis écrivez

N'écrasez pas le nouveau texte directement par-dessus le texte existant. Utilisez d'abord inpaint pour effacer le texte original (laissez le mot d'invite vide ou écrivez remove text). Après avoir confirmé que l'arrière-plan est propre, effectuez un deuxième inpaint pour écrire un nouveau texte. Deux étapes sont plus sûres qu’une.

Les mots de rappel négatifs ne peuvent pas être omis

Les mots d'invite négatifs de Stable Diffusion ont un grand impact sur l'effet de rendu du texte. garbled text, duplicate letters, extra glyphs Ces trois éléments sont presque un incontournable.


Un workflow complet d'invite de modification de mot

Prenons l’exemple d’une affiche promotionnelle chinoise. Le titre doit être remplacé par des caractères tronqués par « Offre spéciale à durée limitée » :

Étape 1 : Effacer le texte original

正向:clean background, remove all text, preserve gradient and shadows
负向:text, letters, words, watermark
参数:strength=0.40, guidance_scale=5.0, steps=30

Étape 2 : Écrivez un nouveau texte

正向:place bold Chinese text "限时特惠" centered in the masked area, modern sans-serif font, crisp sharp strokes, uniform character spacing
负向:garbled text, wrong strokes, missing strokes, blur, extra characters
参数:strength=0.30, guidance_scale=6.0, steps=36

Étape 3 : Vérification

Utilisez l'OCR pour extraire un nouveau texte et le comparer mot à mot avec des « offres spéciales à durée limitée ». En cas d'écart, revenez à l'étape 2 pour affiner les mots d'invite ou les paramètres.


Résumé en une phrase

La structure à quatre couches du mot d'invite (contenu du texte + style de glyphe + contraintes géométriques + éléments invariants) détermine la précision du rendu du texte. Séparer ces quatre couches est trois fois plus efficace que de regrouper toutes les informations en une seule boule.

Vous voulez essayer les effets de différentes manières d’écrire des mots d’invite ? Utilisez la même image pour modifier plusieurs ensembles de mots d'invite différents sur gpt-image2ai.art, et vous ressentirez intuitivement l'écart entre les instructions précises et les descriptions vagues.

Try GPT Image 2 for Free Now →

Articles liés