Rehber Stable Diffusion WebUI yapay zeka ile resim oluşturun

19334-2485104880-Diffusers-Disty0-SoteMix [models-Dif].jpg

Model: SoteMix V1


Bu rehberimizde Stable Diffusion WebUI ile fotoğraf oluşturacağız.
Stable Diffusion WebUI kurulumu için diğer rehberlere bakabilirsiniz, bu rehberde zaten kurduğunuzu varsayıyoruz.



Stable Diffusion Modelleri:
İlk önce ihtiyacımıza uygun bir model indirmeliyiz. Bunun için HuggingFace, CivitAI ve TensorART gibi web sitelerinden modellere bakabilirsiniz.

Modelleri indirirken varsa Pruned, FP16 ve SafeTensors seçeneklerini indirin.
Pruned, modeli eğitmek için gereken verilerin kırpılmış hali.
FP16 ise çok daha küçük boyutlu ve çok daha hızlı çalışan hali.
Dosya biçimi .safetensors değilse virüs entegre edilebilme ihtimali var.

Model dosyalarını, Stable Diffuison WebUI dosyalarında model klasörü içindeki Stable-diffusion klasörüne atın.

VAE:
Yeni modellerin çoğunda ekstradan VAE indirmek gerekli değil, modelin içinde düzgün bir VAE bulunmalı.
Eski modellerde sorunlu VAE olabiliyor, açıklamalarını kontrol edin.

Ekstra bir bir VAE dosyasını kullanmak istiyorsanız eğer;
VAE dosyalarını Stable Diffuison WebUI dosyalarında model klasörü içindeki VAE klasörüne atın.
Daha sonra Stable Diffusion WebUI ayarlarından User Interface menüsünde Quicksettings list'e sd_vae ekleyin.
En son böyle olmalı yani: sd_model_checkpoint, sd_vae
Daha sonra Stable Diffuison WebUI'ı yeniden başlatın.
Yeniden başlattıktan sonra model seçiminin yanında VAE seçimi de gelmiş olmalı.



Text2Img kullanımı:

Pozitif:

Modelin çizmesini istediğiniz şeyleri buraya yazın.
Girdi girerken cümle olarak girmek yerine gerçekçi fotoğraflar için ShutterStock tarzı sitelerdeki veya anime tarzı için Booru tarzı sitelerdeki etiketler gibi girdi yazmaya çalışın.
Yapay zeka bu etiketler ile eğitildi ve bu dilden anlıyor, cümle gibi girerseniz saçmalayabilir.
Kullandığınız modelin açıklama kısmında neler girmeniz gerektiği yazar, bunlar olmadan kötü sonuçlar alabilirsiniz.

Negatif:
Modelin çizmesini istemediğiniz şeyleri pozitifte anlattığımız gibi buraya girebilirsiniz.
Kullandığınız modelin açıklama kısmında neler girmeniz gerektiği yazar, bunlar olmadan kötü sonuçlar alabilirsiniz.

Çözünürlük:
Çözünürlük için 1024x1024'ü geçmeyecek şekilde VRAM'iniz yettiği kadar yükseltebilirsiniz.
1024x1024'ü geçtiğinizde sapıtıp birden fazla karakter çizmeye başlıyor genelde.
Çözünürlük 8'in katları olmalı. Yani 540 giremezsiniz ama 536 veya 544 girebilirsiniz.

Sampling Steps:
Fotoğrafın kaç kere işlendiğini seçer.
Genellikle 20-30 arası yeterli.

Sampling Method:
Fotoğrafı oluşturmak için ilk gürültüyü oluşturma algoritmasını seçer.
İndirdiğiniz modelin açıklamasında genellikle hangisini kullanmanız gerektiği yazar.
Ben DPM++ 2M Karras kullanıyorum.

Seed:
Minecraft'ta harita oluşturur gibi gürültü oluşturmak için kullanacağımız Seed'i belirler.
Aynı Seed aynı resmi üretir.

Clip Skip:
Stable Diffusion modelleri, örnek olarak insan oluştururken ilk önce insan daha sonra cinsiyet gibi parça parça ilerleyip oluşturuyor.
Clip Skip ise ara adımları atlayıp direkt oluşturmaya geçiyor.
İndirdiğiniz modelin açıklamasında ne kullanmamanız gerektiği yazar.
1 veya 2 kullanın.

CFG Scale:
Modelin girdide ne yazdığına ne kadar dikkat etmesi gerektiğini belirler.
İndirdiğiniz modelin açıklamasında ne girmeniz gerektiği yazar.
Çok fazla girerseniz sapıtabilir, varsayılanda kalması daha iyi.

Hires fix:
Ayrıca Img2Img kullanmak yerine fotoğrafı üretirken çözünürlük arttırmaya yarar.
Değerler Inpaint bölümünde anlatıldı.

Text2Img ile Örnek Resim:
Pozitif:
Kod:
(masterpiece, best quality), (1girl, (solo)), dark blue hair, blue eyes, long hair, beautiful hair, beautiful eyes, eye highlights, sharp eyes, off shoulder, slight smile, straight hair, japanese dress, dark dress, forest, vegetation, flowers, trees, foreground, middle ground, background, naturalistic, figurative, representational, impressionistic, expressionistic, abstract, innovative, experimental, unique, highres, japanese house,

Negatif:
Kod:
(EasyNegative, badhandv4), (worst quality, low quality:1.4), (realistic, lip, nose, tooth, rouge, lipstick, eyeshadow:1.0), text, title, logo, signature, disfigured, weird hands, broken fingers, extra fingers, missing fingers, fused fingers, mutated hands, kid, loli, 2girls, hands,

Steps: 30
Sampler: DPM++ 2M Karras
CFG scale: 6
Seed: 1797725206
Size: 1024x576
Model hash: 30c506d600
Model: nyanMix_230303Intense
VAE: blessed2.vae
Clip skip: 2

text2img.jpg




Img2Img:
Girdi fotoğrafını baz alarak yeni fotoğraf üretir.

Üstte de gördüğünüz gibi çıktı fotoğrafının çözünürlüğü çok düşük.
Çözünürlük için fotoğrafı Img2Img'a gönderip yüksek çözünürlüklü yeni fotoğraf üreteceğiz.
Not: Yüksek çözünürlük için Sub-quadratic optimizerini kullanın. Ek olarak 8 GB üstü VRAM de gerekli.

Girdiler:
Girdileriniz Txt2Img ile aynı olsun, sadece çözünürlüğü yükseltin.
Çözünürlük için Scale seçeneğini de kullanabilirsiniz.
Seed için isterseniz farklı Seed'ler de deneyebilirsiniz.

Resize Mode:
Girdi fotoğrafını modele vermeden önce çözünürlüğünü nasıl değiştireceğini seçer.
Yeni fotoğraf ürettiğimiz için Just Resize seçin.

Denoising Strength:
Girdi fotoğrafını ne kadar değiştireceğini belirler.
Çok az girerseniz fotoğraf bulanık ve gürültülü olabilir.
0.5-0.7 arasını kullanabilirsiniz. Ben 0.6 kullanıyorum.


Img2Img ile Örnek Resim:

img2img.jpg




Inpainting:
Fotoğrafta istemediğimiz yerleri tekrar ürettirmek için kullanılır:
Üstteki resimde (Text2Img resmi) elleri çizmesin diye kullanabiliriz.

Resmi yükleyip tekrar oluşturmasını istediğiniz yeri boyayın.

Girdiler:
Girdi açıklamalarını Img2Img'da yaptık, Inpainting'de de aynı şekilde ama burada çözünürlüğü ellemeyin.

Mask Mode:
Boyadığınız yeri mi yoksa boyanmayan yeri mi tekrar oluşturması gerektiğini seçer.
Boyadığınız yeri tekrar oluşturmasını istiyorsanız Inpaint Masked seçin.

Masked Content:
Boyadığınız yeri oluşturmadan önce neyle doldurması gerektiğini seçer.
Original seçerseniz boyadığınız kısmı değiştirmeden modele verir.
Sıfırdan oluşturması için Latent Noise kullanın.

Inpaint Area:
Resim oluşturduktan sonra bütün resmi mi değiştirsin yoksa sadece seçtiğiniz resmi mi değiştirsin diye seçer.
Bütün resmi değiştirmesi daha iyi, aksi halde değiştirdiğiniz yer çok sırıtıyor.
Bütün resmi değiştirmesi için Whole Picture seçeneğini seçin.

Inpainting ile Örnek Resim:
Text2Img'dan aldığımız resimden elleri sildik.

inpaint.jpg


Inpainting'den Sonra Img2Img ile Örnek Resim:

inpaint-img2img.jpg




Upscale:
En son olarak bulanıklığı gidermek için Extras (veya Process) kısmından çözünürlük yükseltebilirsiniz.
Upscaler olarak;
R-ESRGAN / R-ESRGAN 4x+ Anime 6b, (Hızlı Çalışır)
ESRGAN 4x UltraSharp / ESRGAN 4x AnimeSharp (Orta Hızlı)
SwinIR (Yavaş Çalışır) önerebilirim.

Stable Diffuison WebUI ile gelen Upscaler'ler 4x için olduğu için ben Waifu2x ile 2x upscale ediyorum.

Upscale Sonrası Örnek Resim:

inpaint-img2img.jpg-2x.jpg




Örnek olması açısından kısa bir video:

Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.
 
Son düzenleme:
Ben de kullandığım modelleri önerebilirim:
Screenshot_1.png


Counterfeit + Easynegative iyi bir ikili.
 
Bunu 512x512 oluşturdum.
512.jpg

Daha sonra img2img'a yolalyıp 1024x1024'te tekrar işledim.
1024 img.jpg

Daha sonra 1440x1440'ta tekrar işledim.
1440.jpg

Son olarak da Direkt Text2img'da 1024x1024 olarak işlemeyi denedim.
1024 text to.jpg

Kullandığım model. Realistic Vision 2.0 bu arada.

img2img'da 2048x2048'de işlemeyi de denedim fakat çok uzun sürdü ve üretemedi, sadece siyah bir ekran verdi.

@Disty
 
Daha sonra 1440x1440'ta tekrar işledim.
1440.jpg

Denoising Strength'i düşürün.


img2img'da 2048x2048'de işlemeyi de denedim fakat çok uzun sürdü ve üretemedi, sadece siyah bir ekran verdi.
2048x2048 için 16 GB VRAM yetmiyor ve Sistem RAM'ini kullanıyor.
2000x2000 ile deneyin.
Uzun sürmesi normal. 512x512'nin 16 katı sonuçta.
 
Denoising Strength'i düşürün.



2048x2048 için 16 GB VRAM yetmiyor ve Sistem RAM'ini kullanıyor.
2000x2000 ile deneyin.
Uzun sürmesi normal. 512x512'nin 16 katı sonuçta.
Teşekkürler. Denoising Strength diye bir şeyin varlığını unutmuşum. 🤦‍♂️ Düşürünce sorunsuz upscale etmiş oldum. Zaten Denoising Strength'i düşürünce işlem daha kolaylaşıyor, hızlı bitiyor.

Yeni ekran kartına geçince biraz coştum her şeyi 1024, 1440 üretmeye çalıştım ama o iş öyle olmuyormuş demek ki. :D Gerçi zaten buna gerek var mı bilmiyorum. Sonucunu bilmediğin bir işlem için daha uzun süre beklemektense daha hızlı hızlı sonuçlar alıp beğendiğini upscale etmek daha mantıklı sanırım.
 
promt: (masterpiece),smiling, best quality, expressive eyes, perfect face,perfect body and body parts, blonde hair,tall and slim,medium size breast, beautiful, cute, 18 years old girl,((dressed in a shirt and trousers)),(in the streets of turkey),(hd,Canon EOS 5D Mark IV, EF 50mm f/1.8 STM lens, 30.4MP, ISO 32000, 1/200s. (Full-body shot but focused on the girls face), shallow depth of field, woman in focus. Render in 16k, 16:9, v5.1, quality 2, size 750,RAW photo)

negative prompt: jpg,(worst quality, low quality:1.4), (greyscale, monochrome:1.1), cropped, lowres , username, blurry, trademark, watermark, title, multiple view, Reference sheet, curvy, plump, fat, strabismus, clothing cutout, side slit,worst hand, (ugly face:1.2), extra leg, extra arm, bad foot, text, name, easynegative, badhandsv5-neg, bad-artist,nsfw, bad_prompt_version2

DPM++ 2M Karras
waifu2xle upscale ettim.
 

Dosya Ekleri

  • image (1)_waifu2x_noise0_scale4x.png
    image (1)_waifu2x_noise0_scale4x.png
    1 MB · Görüntüleme: 222
Merhaba, model eğitmek için 12 gb ekran kartı yeterli mi yoksa 16gb mı almak gerekir. 12gb 4070ti aldım ama iade edip 4080 16gb mi zorlasam emin olamadım. Yardımcı olursanız sevinirim.
 
Merhaba, model eğitmek için 12 gb ekran kartı yeterli mi yoksa 16gb mı almak gerekir. 12gb 4070ti aldım ama iade edip 4080 16gb mi zorlasam emin olamadım. Yardımcı olursanız sevinirim.
Lora için 12 GB idare eder ama 16 GB alabiliyorsanız kesinlikle 16 GB alın.
SDXL Finetune için 24 GB alın.
 
Bazı defolu çıkan uzuvları sampling step'i artırarak çözebilir miyiz prompt yazmak dışında?
30-40'a kadar evet. Ama 40'tan sonra pek bir iyileşme göremezsiniz.
Bunun için Inpaint kullanmanız daha iyi olur.
 

Yeni konular

Geri
Yukarı