Çözüldü Stable Diffusion'da training yaparken "half Precision" hatası

38life · 9 Haziran 2023

Stable Diffusion Vladmandic forkunda Train embedding yaptığımda,

For now, XPU device does not support model training with half precision.

Hatası alıyorum. Bu half Precision kapatılabilir mi? Kapatılırsa ne olur? Bunları merak ediyorum.

İşletim Sistemi: Ubuntu 22.04
Ekran Kartı: Intel Arc A770

mertcandanzz · 9 Haziran 2023

Baslatma komutlari arasina --no-half komutunu eklersen sorunun cozulecektir.

Disty · 9 Haziran 2023

Bu sorun Intel ile alakalı. Şu anda float16 training desteği yok, bfloat16 kullanmalısınız.
Compute Settings ayarlarından "Device precision type" seçeneğini BF16 olarak seçin.
Ek olarak Batch Size olarak 4'ü geçmeyin, Intel sürücüleri sapıtmaya başlıyor yoksa.

GradScaler için de bu rehberdeki Training adımlarını uygulayın:

Rehber: Intel ARC ekran kartları ile Stable Diffusion WebUI kurulumu

Bu rehberimizde Intel ARC ekran kartları ile Stable Diffusion WebUI'ın Vladmandic çatalını kuracağız. Stable Diffusion kurulumuna geçmeden önce ilk olarak bilgisayarımıza bir şekilde Linux kurmalıyız. Intel PyTorch kütüphanesi sadece Linux üzerinde çalışıyor. Windows kullanıyorsanız WSL içinde...

www.technopat.net

38life · 9 Haziran 2023

Disty dedi:
Bu sorun Intel ile alakalı. Şu anda float16 training desteği yok, bfloat16 kullanmalısınız.
Compute Settings ayarlarından "Device precision type" seçeneğini BF16 seçin.

Ek olarak Intel ile GradScaler fonksiyonunun GPU versiyonu olmadığından training hala çalışmıyor.

Yani BF16'yı seçsem de yine işlem başarısız olacak doğru mu anlıyorum?

Disty · 9 Haziran 2023

38life dedi:
Yani BF16'yı seçsem de yine işlem başarısız olacak doğru mu anlıyorum?

Evet, GradScaler fonksiyonun düzeltilmesi gerek.

38life · 9 Haziran 2023

Disty dedi:
Evet, GradScaler fonksiyonun düzeltilmesi gerek.

O halde beklemekten başka çare yok. Ya da şunu sorayım yeni başlık açmadan. Bildiğim kadarıyla 4 tane training yöntemi/aracı var:
Dreambooth,
Textual Inversion,
Hypernetwork,
Lora.

Dreambooth ve Textual Inversion'ı kullanamıyoruz Intel'de. Hypernetwork ve Lora'da durum nedir? Bari bir tanesi çalışsın.

LORA sanırım Kohya diye bi eklenti ile yapılıyor. Youtube'da Linux için tutorial'ı var fakat hep bir CUDA lafı geçiyor işlemlerde. Yorumlara "bu işlemleri Intel GPU ile yapabilir miyiz" yazdım. Adam kalp attı cevap vermedi.

Disty · 10 Haziran 2023

38life dedi:
O halde beklemekten başka çare yok. Ya da şunu sorayım yeni başlık açmadan. Bildiğim kadarıyla 4 tane training yöntemi/aracı var:
Dreambooth,
Textual Inversion,
Hypernetwork,
Lora.

Dreambooth ve Textual Inversion'ı kullanamıyoruz Intel'de. Hypernetwork ve Lora'da durum nedir? Bari bir tanesi çalışsın. LORA sanırım Kohya diye bi eklenti ile yapılıyor. Youtube'da Linux için tutorial'ı var fakat hep bir CUDA lafı geçiyor işlemlerde. Yorumlara "bu işlemleri Intel GPU ile yapabilir miyiz" yazdım. Adam kalp attı cevap vermedi.

GradScaler sağ olsun şu anda hiçbiri çalışmıyor.
Farklı yöntemlerle GradScaler'ı sadece CPU ile çalıştırmayı denedim ama inatla GPU'yu kullanmaya çalışıyor ve hata veriyor.

38life · 10 Haziran 2023

Disty dedi:
GradScaler sağ olsun şu anda hiçbiri çalışmıyor.
Farklı yöntemlerle GradScaler'ı sadece CPU ile çalıştırmayı denedim ama inatla GPU'yu kullanmaya çalışıyor ve hata veriyor.

Anladığım kadarıyla GradScaler training işi için şart. Yöntem araç fark etmiyor. Sağlık olsun. Bekleriz İlla çözülecektir. Zaten hata mesajında bile "for now" demişler.

Eğer GradScaler olayı düzeltilirse bununla ilgili rehber veya duyurmak mahiyetinde bi konu açarsan süper olur bu arada. Ben senin profil için bildirimleri açtım. Takipteyim.

Disty · 12 Haziran 2023

Training için GradScaler'i devre dışı bıraktım ve çalışıyor gibi.
WebUI'ı güncelleyip BF16 ile deneyebilirsiniz.
Güncellemek için:

Bash:

git pull

38life · 13 Haziran 2023

Disty dedi:
Training için GradScaler'i devre dışı bıraktım ve çalışıyor gibi.
WebUI'ı güncelleyip BF16 ile deneyebilirsiniz.
Güncellemek için:

Bash:

git pull

Güncelledim. GradScaler'ı kapatmak için bir seçenek bulamadım ama textual inversion denediğimde train etti ama benim gösterdiğim directory ile alakasız resimler çıkardı, ve sonlara doğru tamamen noise'lı resimler çıkardı. Train ederken de zaten sürekli step xx loss diyor.

Çözüldü Stable Diffusion'da training yaparken "half Precision" hatası

Ayrıntılı düzenleme

38life

Kilopat

Disty

Rehber: Intel ARC ekran kartları ile Stable Diffusion WebUI kurulumu

mertcandanzz

Kilopat

Disty

Megapat

Rehber: Intel ARC ekran kartları ile Stable Diffusion WebUI kurulumu

38life

Kilopat

Disty

Megapat

38life

Kilopat

Disty

Megapat

38life

Kilopat

Disty

Megapat

38life

Kilopat

Benzer konular

Yeni konular

Yeni mesajlar

Gizliliğinize önem veriyoruz