同一個模型，同一個需求，提示詞寫法不同，文字準確率可以差三倍。

同一個模型，同一個需求，提示詞寫法不同，文字準確率可以差三倍。

提示詞不是玄學，是工程

很多人寫 AI 圖像提示詞的方式是"想到什麼寫什麼"，然後發現文字總是出錯，就覺得"模型不行"。但同樣的模型，同樣的需求，有人的文字準確率能到 80%，有人只有 20%──差別就在提示詞的寫法上。

提示詞工程不是"把描述寫得很長"，而是把文字內容、字形風格、幾何約束、不變元素四個維度分開說清楚。模型需要的不是你的感嘆號和形容詞，而是精確的指示。

這篇文章會給你一套可直接復用的提示詞模板庫，涵蓋 Stable Diffusion、OpenAI GPT Image 2、Midjourney 三個主流平台，按海報、標籤、資訊圖三種場景分類，每個模板都附帶參數說明和避坑指南。

提示詞的四層結構

不管用哪個模型，文字渲染的提示詞都應該包含四層資訊：

第一層：文字內容。 需要出現在畫面中的具體文字。用引號包裹，明確告訴模型"這些字必須精確呈現"。

第二層：字形風格。 字型類型（襯線/無襯線）、字重（粗體/常規）、字層級。寫"現代中文無襯線字體，標題加粗"比寫"用思源黑體"有效－模型不一定認識具體字體名，但能理解風格描述。

第三層：幾何約束。 文字的位置、大小、對齊方式、行距字距。越精確，模型越不容易自作主張。

第四層：不變元素。 哪些東西不能改－背景紋理、光影、產品本體、透視關係。用 preserve 、 do not change 、 maintain 這類約束詞。

把這四層拆開寫，比把所有資訊揉成一團長句子有效得多。

平台一：Stable Diffusion Inpainting 提示詞

Stable Diffusion 的 inpainting 是做局部修字最靈活的方案之一。它的提示詞分正向和負向兩部分。

正向提示單字模板

replace only the masked text with crisp [字體風格] text '[目標文字]',
exact baseline alignment, preserve poster texture, lighting, shadows, perspective

負向提示詞模板

garbled text, duplicate letters, extra glyphs, warped text, blur, low contrast, artifacts

關鍵參數

參數	建議值	說明
`strength`	0.25-0.45	越低越保守，保留更多原圖資訊。 0.25 適合只改字不改背景，0.45 適合需要微調周圍區域
`guidance_scale`	4-7	越高越遵循提示詞，但過高會導致過度銳利化
`num_inference_steps`	28-40	步數越多品質越好，但速度越慢

海報標題模板

正向：replace masked headline with bold white sans-serif text 'SUMMER SALE',
crisp sharp edges, exact horizontal alignment, preserve gradient background and shadows

負向：garbled text, misspelled words, duplicate letters, warped baseline, blur, extra characters

參數： strength=0.30, guidance_scale=5.5, steps=32

品牌名稱模板

正向：replace masked text with clean logo-style text 'NATURA',
letter-spacing uniform, preserve brand color scheme and background texture

負向：garbled text, wrong font weight, uneven spacing, artifacts, low resolution

參數： strength=0.25, guidance_scale=6.0, steps=36

遮罩建議

海報標題：單字級矩形遮罩，向外擴展 2-6px
品牌名稱：整體矩形遮罩，包含周圍留白
價格數字：精確矩形遮罩，不擴展－數位區域的背景通常很簡單，擴展反而引入噪聲

平台二：OpenAI GPT Image 2 編輯串流提示詞

GPT Image 2 的編輯流程透過 mask 參數實現局部修改。提示詞需要用自然語言描述"只改什麼、保持什麼"。

基本語法

from openai import OpenAI
client = OpenAI()

result = client.images.edit(
    model="gpt-image-2",
    image=open("poster.png", "rb"),
    mask=open("mask.png", "rb"),   # 與原圖同尺寸、同格式，帶 alpha 通道
    prompt='Replace only the masked headline with crisp white sans-serif text "OPEN STUDIO". Preserve perspective, paper texture, and shadows.'
)

mask 檔案需求

與原圖同尺寸（像素級一致）
與原圖同格式（皆為 PNG 或都是 JPEG）
帶 alpha 通道（透明區域 = 不修改，不透明區域 = 要修改）
ChatGPT Images 官方幫助頁提醒：選區高亮並不總是精確，編輯可能越過所選區域——所以遮罩區域適當留餘量

海報修字模板

Replace only the masked headline with clean white sans-serif text "SUMMER SALE".
Text must be crisp, sharp, with uniform letter spacing.
Preserve poster background, gradient, shadows, and all unmasked elements.
Do not add extra text, watermarks, or decorative elements.

標籤修字模板

Replace only the masked text area with clean product label text "Ingredients: Water, Glycerin, Niacinamide".
Font: small, precise, uniform sans-serif. Match existing label style.
Preserve bottle shape, label material texture, and all surrounding elements.
Do not change product name, logo, or barcode.

中文海報模板

請只替換蒙版區域的文字為清晰的中文無襯線字體「新消費品牌增長論壇」。
文字必須筆畫完整、大小均勻、行距一致。
保持海報背景、光影、透視和所有未蒙版元素不變。
不要添加額外文字、裝飾或浮水印。

關鍵技巧

技巧一：用引號包裹目標文字。 "SUMMER SALE" 比 SUMMER SALE 更能讓模型理解這是需要精確呈現的內容。

技巧二：明確說"只改蒙版區域"。 Replace only the masked area 比 Fix the text 精確得多——前者限制修改範圍，後者可能會讓模型重新渲染整張圖。

技巧三：列出不能改變的元素。 Preserve background, shadows, perspective, all unmasked elements ——這條約束能顯著減少"改了一個字，背景也變了"的情況。

技巧四：中文場景加上"不要改寫"的約束。 文字必须严格按以下内容排版，不要改写、不要增删、不要替换同义词 ——這對需要法務審核的商業海報至關重要。

平台三：Midjourney 局部修字提示詞

Midjourney 的 Editor 和 Vary Region 功能支援選取範圍重繪。官方建議提示詞短而直接，參數放在最後。

基本語法

clean swiss poster headline::2 geometric background::1 exact text OPEN STUDIO crisp sans serif aligned baseline --ar 2:3 --raw

權重系統

Midjourney 用 :: 分隔提示字的不同部分，後面的數字是權重。對文字渲染，把文字內容的權重設高：

exact text "SUMMER SALE"::3 clean poster design::1 minimalist background::1 --ar 16:9 --raw

::3 表示文字內容的權重是其他部分的 3 倍，模型會更努力地把字寫對。

海報標題模板

clean bold sans-serif headline text "SUMMER SALE"::3 geometric gradient poster background::1 exact baseline alignment sharp crisp edges --ar 16:9 --raw

品牌識別模板

logo text "NATURA"::3 clean minimalist brand identity::1 letter-spacing uniform professional typography --ar 1:1 --raw

Midjourney 的限制

Midjourney 的強項是視覺風格，不是文字精準度。對長文本（超過 5 個單字）和精確字距的控制力弱於 Stable Diffusion 和 GPT Image 2。它的最佳用途是：風格化短詞、概念海報標題、品牌名的快速迭代。

跨平台通用技巧

不管用哪個模型，以下技巧都能提昇文字渲染的準確率：

用引號包裹目標文字

把需要出現在畫面中的文字用引號括起來，模型會把它當作"必須精確呈現"的內容，而不是"可以自由發揮"的描述。這個技巧在所有平台上都有效。

明確宣告位置

不要只寫"把標題放在頂部"，要寫"主標題居中放置在畫面頂部 20% 區域，字號最大"。越精確，模型越不容易自作主張。

指定字體風格而非字體名稱

寫"現代無襯線字體，標題加粗"比寫"用 Helvetica"有效。模型不一定認識具體字體名，但能理解風格描述。

控製文字數量

每次只修 1-3 個單字或片語。文字越多，出錯機率越高。如果需要修改多個文字區域，分多次操作，每次處理一個區域。

先擦後寫

不要直接在原有文字上覆蓋新文字。先用 inpaint 把原有文字擦除（提示字留空或寫 remove text ），確認背景乾淨後，再做第二次 inpaint 寫入新文字。兩步比一步穩。

負面提示詞不能省

Stable Diffusion 的負面提示詞對文字渲染效果影響很大。 garbled text, duplicate letters, extra glyphs 這三條幾乎必須帶上。

一個完整的修字提示詞工作流程

以一張中文促銷海報為例，需要把標題從亂碼修成"限時特惠"：

Step 1：擦除原有文字

正向：clean background, remove all text, preserve gradient and shadows
負向：text, letters, words, watermark
參數：strength=0.40, guidance_scale=5.0, steps=30

Step 2：寫入新文字

正向：place bold Chinese text "限時特惠" centered in the masked area, modern sans-serif font, crisp sharp strokes, uniform character spacing
負向：garbled text, wrong strokes, missing strokes, blur, extra characters
參數：strength=0.30, guidance_scale=6.0, steps=36

Step 3：校驗

用 OCR 提取新文字，和"限時特惠"逐字比對。如果有偏差，回到 Step 2 微調提示詞或參數。

一句話總結

提示词的四层结构（文本内容 + 字形风格 + 几何约束 + 不变元素）决定了文字渲染的准确率。把这四层拆开写，比把所有信息揉成一团有效三倍。

想親手試試不同提示詞寫法的效果差異？在 gpt-image2ai.art 上用同一個圖片分別跑幾組不同提示詞的編輯，你會直觀感受到精確指令和模糊描述之間的差距。

Try GPT Image 2 for Free Now →

提示詞寫對了，AI 的字就對了一半：文字渲染提示詞工程實戰

提示詞不是玄學，是工程

提示詞的四層結構

平台一：Stable Diffusion Inpainting 提示詞

正向提示單字模板

負向提示詞模板

關鍵參數

海報標題模板

品牌名稱模板

遮罩建議

平台二：OpenAI GPT Image 2 編輯串流提示詞

基本語法

mask 檔案需求

海報修字模板

標籤修字模板

中文海報模板

關鍵技巧

平台三：Midjourney 局部修字提示詞

基本語法

權重系統

海報標題模板

品牌識別模板

Midjourney 的限制

跨平台通用技巧

用引號包裹目標文字

明確宣告位置

指定字體風格而非字體名稱

控製文字數量

先擦後寫

負面提示詞不能省

一個完整的修字提示詞工作流程

一句話總結

相關文章

一張圖從 3 分錢到 1 塊錢：GPT Image 2 和 Nano Banana 2 的真實成本帳

GPT 影像 2 中設計人員的高階提示工作流程

電商產品圖的帳，該重新算了：AI 生圖 vs 傳統攝影，到底誰更划算？