Aynı model, aynı gereksinim, ancak hızlı sözcükler farklı şekillerde

Aynı model, aynı gereksinim, ancak istem sözcükleri farklı şekillerde yazıldığından metin doğruluğu üç kat daha kötü olabilir.

Öne çıkan kelime metafizik değil mühendisliktir

Pek çok kişinin yapay zeka görseli istem sözcüklerini yazma şekli, "akla gelen her şeyi yazmak" ve ardından metnin her zaman hata yaptığını görmek ve "modelin iyi olmadığını" hissetmektir. Ancak aynı model ve aynı gereksinimlerle, bazı kişilerin metin doğruluğu %80'e ulaşırken diğerleri yalnızca %20'ye ulaşabilir; fark, hızlı sözcüklerin yazılma biçiminde yatmaktadır.

Bilgi istemi kelimesi projesi "uzun bir açıklama yazmak" değil, metin içeriğinin, glif stilinin, geometrik kısıtlamaların ve değişmez öğelerin dört boyutunu açıkça tanımlamaktır. Modelin ihtiyacı olan şey, ünlem işaretleriniz ve sıfatlarınız değil, kesin talimatlardır.

Bu makale size Stable Diffusion, OpenAI GPT Image 2 ve Midjourney'in üç ana platformunu kapsayan, doğrudan yeniden kullanılabilecek bir dizi hızlı kelime şablonu kitaplığı verecektir. Üç senaryoya ayrılırlar: posterler, etiketler ve infografikler. Her şablon, parametre açıklamaları ve tuzak kılavuzlarıyla birlikte gelir.

Bilgi istemi sözcüklerinin dört katmanlı yapısı

Hangi model kullanılırsa kullanılsın, metin oluşturmaya yönelik bilgi istemi sözcükleri dört bilgi katmanı içermelidir:

İlk katman: metin içeriği. Ekranda görünmesi gereken özel metin. Modele açıkça "bu sözcüklerin tam olarak oluşturulması gerektiğini" belirtmek için bunu tırnak işaretleri içine alın.

İkinci katman: glif stili. Yazı tipi türü (serif/sans serif), yazı tipi ağırlığı (kalın/normal), yazı tipi boyutu düzeyi. "Modern Çince sans serif yazı tipi, kalın başlık" yazmak, "Siyuan Heibo Kullan" yazmaktan daha etkilidir; model belirli yazı tipi adını bilmeyebilir ancak stil açıklamasını anlayabilir.

Seviye 3: Geometrik kısıtlamalar. Metnin konumu, boyutu, hizalaması ve satır aralığı. Model ne kadar doğru olursa kendi kararlarını vermesi o kadar az olası olur.

Seviye 4: Değişmeyen elemanlar. Neler değiştirilemez - arka plan dokusu, ışık ve gölge, ürün gövdesi, perspektif ilişkisi. preserve, do not change, maintain gibi kısıtlamaları kullanın.

Bu dört katmanı parçalayıp yazmak, tüm bilgileri tek bir uzun cümleye sığdırmaktan çok daha etkilidir.

Platform 1: Kararlı Difüzyon İç Boyama komut sözcükleri

Stabil Difüzyon'un iç boyaması, yerel karakter modifikasyonu için en esnek çözümlerden biridir. Uyarı sözcükleri iki kısma ayrılır: olumlu ve olumsuz.

Olumlu istem kelime şablonu

🚫KOD0🚫

Olumsuz bilgi istemi kelime şablonu

🚫KOD1🚫

Anahtar parametreler

Parametreler	Önerilen değerler	Açıklama
`strength`	0,25-0,45	Değer ne kadar düşük olursa, o kadar muhafazakar olur ve daha fazla orijinal görüntü bilgisi korunur. 0,25, arka planı değiştirmeden yalnızca metni değiştirmek için uygundur, 0,45 ise çevredeki alanda ince ayar yapmak için uygundur
`guidance_scale`	4-7	Değer ne kadar yüksek olursa, o kadar çok hızlı sözcük takip edilir, ancak çok yüksek olması aşırı keskinleştirmeye neden olur
`num_inference_steps`	28-40	Ne kadar çok adım olursa kalite o kadar iyi olur, ancak hız da o kadar yavaş olur

Poster başlığı şablonu

🚫KOD2🚫

Parametreler: strength=0.30, guidance_scale=5.5, steps=32

Marka adı şablonu

🚫KOD3🚫

Parametreler: strength=0.25, guidance_scale=6.0, steps=36

Maskeleme önerileri

Poster başlığı: Kelime düzeyinde dikdörtgen maske, dışa doğru 2-6 piksel genişliyor
Marka adı: Çevreleyen beyaz alan da dahil olmak üzere genel dikdörtgen maske
Fiyat numaraları: tam dikdörtgen maske, genişleme yok - sayı alanının arka planı genellikle çok basittir ve genişleme gürültüye neden olur

Platform 2: OpenAI GPT Görüntü 2 düzenleme akışı istem sözcükleri

GPT Görüntüsü 2'nin düzenleme akışı, maske parametresi aracılığıyla yerel değişikliği uygular. Bilgi isteminin doğal dilde "yalnızca neyin değiştirileceğini ve neyin tutulacağını" tanımlaması gerekir.

Temel sözdizimi

🚫KOD4🚫

maske dosyası gereksinimleri

Orijinal görüntüyle aynı boyutta (piksel düzeyinde tutarlı)
Orijinal görselle aynı formatta (hem PNG hem de JPEG)
alfa kanalı ile (şeffaf alanlar = değiştirilmez, opak alanlar = değiştirilecek)
ChatGPT Görüntüleri resmi yardım sayfası hatırlatıcısı: seçimin vurgulanması her zaman doğru değildir ve düzenleme seçilen alanı aşabilir - bu nedenle maske alanında uygun kenar boşlukları bırakın

Poster yazı şablonu

🚫KOD5🚫

Etiket değiştirme şablonu

🚫KOD6🚫

Çin poster şablonu

🚫KOD7🚫

Önemli İpuçları

İpucu 1: Hedef metni tırnak işaretleri içine alın. "SUMMER SALE", modelin doğru şekilde temsil edilmesi gereken şeyin bu olduğunu anlaması için SUMMER SALE'den daha iyidir.

İpucu 2: Açıkça "yalnızca maskelenen alanı değiştirin" deyin. Replace only the masked area, Fix the text'den çok daha doğrudur - ilki değişikliklerin kapsamını sınırlarken ikincisi modelin tüm görüntüyü yeniden oluşturmasına neden olabilir.

İpucu 3: Değiştirilemeyecek öğeleri listeleyin. Preserve background, shadows, perspective, all unmasked elements - Bu kısıtlama "kelime değişirse arka plan da değişir" durumunu önemli ölçüde azaltabilir.

İpucu 4: Çin sahnesine "yeniden yazma" kısıtlamasını ekleyin. 文字必须严格按以下内容排版，不要改写、不要增删、不要替换同义词 - Bu, yasal inceleme gerektiren iş posterleri için çok önemlidir.

Platform 3: Yolculuğun ortasında kısmi kelime değişikliği istemleri

Midjourney Editörü ve Vary Region özellikleri, seçimin yeniden çizilmesini destekler. Yetkililer istemlerin kısa ve doğrudan olmasını ve parametrelerin sona yerleştirilmesini öneriyor.

Temel sözdizimi

🚫KOD8🚫

Ağırlık sistemi

Midjourney, istem sözcüğünün farklı bölümlerini ayırmak için :: kullanır ve aşağıdaki sayı ağırlıktır. Metin oluşturma için metin içeriğinin ağırlığını yüksek ayarlayın:

🚫KOD9🚫

::3, metin içeriğinin ağırlığının diğer parçaların ağırlığının 3 katı olduğu ve modelin kelimeleri doğru yazmak için daha çok çalışacağı anlamına gelir.

Poster başlığı şablonu

🚫KOD10🚫

Marka Kimliği Şablonu

🚫KOD11🚫

Yolculuğun Ortasındaki Sınırlamalar

Midjourney'in gücü metinsel kesinlik değil, görsel stildir. Stable Diffusion ve GPT Image 2'ye göre uzun metin (5 kelimeden fazla) ve hassas karakter aralığı üzerinde daha az kontrol. En iyi kullanım alanları şunlardır: Stilize edilmiş kısa kelimeler, konsept poster başlıkları, marka adlarının hızlı yinelenmesi.

Platformlar arası genel beceriler

Hangi model kullanılırsa kullanılsın, aşağıdaki ipuçları metin oluşturmanın doğruluğunu artırabilir:

Hedef metni tırnak içine alın

Resimde görünmesi gereken metni tırnak işaretleri arasına alın; model, bunu "özgürce oynatılabilecek" bir açıklama yerine "doğru şekilde sunulması gereken" içerik olarak ele alacaktır. Bu hile tüm platformlarda çalışır.

Konumu açıkça bildir

Sadece "başlığı en üste koy" yazmayın, "ana başlığı ekranın en üst %20'sinin ortasına, en büyük yazı tipi boyutuna yerleştirin" yazın. Model ne kadar doğru olursa kendi kararlarını vermesi o kadar az olası olur.

Yazı tipi adı yerine yazı tipi stilini belirtin

"Modern sans serif yazı tipi, kalın başlıklar" yazmak, "Helvetica Kullan" yazmaktan daha etkilidir. Model, belirli yazı tipi adını bilmeyebilir ancak stil açıklamasını anlayabilir.

Metin miktarını kontrol edin

Bir seferde yalnızca 1-3 kelime veya kelime öbeği üzerinde çalışın. Ne kadar çok kelime varsa hata olasılığı da o kadar yüksek olur. Birden çok metin alanını değiştirmeniz gerekiyorsa, bunu her defasında bir alan olmak üzere birden çok kez yapın.

Önce sil sonra yaz

Yeni metnin doğrudan mevcut metnin üzerine yazmayın. İlk önce orijinal metni silmek için inpaint'i kullanın (bilgi istemi kelimesini boş bırakın veya remove text yazın). Arka planın temiz olduğunu doğruladıktan sonra yeni metin yazmak için ikinci bir iç boyama yapın. İki adım bir adımdan daha güvenlidir.

Olumsuz hatırlatıcı sözcükler atlanamaz

Stabil Difüzyon'un negatif istemli kelimelerinin metin oluşturma etkisi üzerinde büyük etkisi vardır. garbled text, duplicate letters, extra glyphs Bu üç öğe adeta olmazsa olmazlardan.

Tam bir kelime değiştirme istemi kelime iş akışı

Örnek olarak bir Çin tanıtım posterini ele alalım. Başlığın, bozuk karakterlerden "Sınırlı süreli özel teklif" olarak değiştirilmesi gerekiyor:

1. Adım: Orijinal metni silin

🚫KOD12🚫

2. Adım: Yeni metin yazın

🚫KOD13🚫

3. Adım: Doğrulama

Yeni metni çıkarmak ve onu kelimesi kelimesine "sınırlı süreli özel teklifler" ile karşılaştırmak için OCR'yi kullanın. Bir sapma varsa, bilgi istemi sözcükleri veya parametrelerine ince ayar yapmak için 2. Adıma geri dönün.

Bir cümlelik özet

Bildirim sözcüğünün dört katmanlı yapısı (metin içeriği + glif stili + geometrik kısıtlamalar + değişmez öğeler) metin oluşturmanın doğruluğunu belirler. Bu dört katmanı ayrı ayrı yazmak, tüm bilgileri tek bir topun içine sıkıştırmaktan üç kat daha etkilidir.

Hızlı sözcükler yazmanın farklı yollarının etkilerini denemek ister misiniz? gpt-image2ai.art üzerinde farklı istem sözcüklerinden oluşan çeşitli kümeleri düzenlemek için aynı görseli kullanın; kesin talimatlar ile belirsiz açıklamalar arasındaki boşluğu sezgisel olarak hissedeceksiniz.

Try GPT Image 2 for Free Now →

Bilgi istemi sözcükleri doğru yazılırsa, AI sözcükleri yarı doğru olacaktır: Metin oluşturma istemi sözcük mühendisliğinin pratik mücadelesi

Öne çıkan kelime metafizik değil mühendisliktir

Bilgi istemi sözcüklerinin dört katmanlı yapısı

Platform 1: Kararlı Difüzyon İç Boyama komut sözcükleri

Olumlu istem kelime şablonu

Olumsuz bilgi istemi kelime şablonu

Anahtar parametreler

Poster başlığı şablonu

Marka adı şablonu

Maskeleme önerileri

Platform 2: OpenAI GPT Görüntü 2 düzenleme akışı istem sözcükleri

Temel sözdizimi

maske dosyası gereksinimleri

Poster yazı şablonu

Etiket değiştirme şablonu

Çin poster şablonu

Önemli İpuçları

Platform 3: Yolculuğun ortasında kısmi kelime değişikliği istemleri

Temel sözdizimi

Ağırlık sistemi

Poster başlığı şablonu

Marka Kimliği Şablonu

Yolculuğun Ortasındaki Sınırlamalar

Platformlar arası genel beceriler

Hedef metni tırnak içine alın

Konumu açıkça bildir

Yazı tipi adı yerine yazı tipi stilini belirtin

Metin miktarını kontrol edin

Önce sil sonra yaz

Olumsuz hatırlatıcı sözcükler atlanamaz

Tam bir kelime değiştirme istemi kelime iş akışı

Bir cümlelik özet

İlgili yazılar

Görsel Başına 3 Sentten 1 Dolara: GPT Image 2 ve Nano Banana 2'nin Gerçek Maliyeti

[tr] Advanced Prompt Workflows for Designers in GPT Image 2

GPT Image 2'de Tasarımcılar için Gelişmiş Bilgi İstemi İş Akışları