Dall·e beta programı deneyimim

Sen komutu vereceksin de sondaki "I want an the image drawn in the style of Blade Runner 2049 Movie" kısmını ufak düzelttim ve hala düşünüyorum bu Geppetto ustanın 3. nesili bizi doğru anlayacak mı? Ver gitsin.

Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Sonuçlar güzel gibi ama sanırım tam istediğimiz gibi olmadı 😅
İlk fotoğraf favorim:

DALL·E 2022-07-23 21.56.45 - Doom Slayer Janissary Fights Medusa in Basilica Cistern. I want a...png
DALL·E 2022-07-23 21.56.35 - Doom Slayer Janissary Fights Medusa in Basilica Cistern. I want a...png
DALL·E 2022-07-23 21.57.00 - Doom Slayer Janissary Fights Medusa in Basilica Cistern. I want a...png
DALL·E 2022-07-23 21.56.54 - Doom Slayer Janissary Fights Medusa in Basilica Cistern. I want a...png
 
Öncelikle bu deneyde kredini paylaştığın için teşekkür ederim.

Kesinlikle ilk görsel en güçlüsü.

Şimdi görsellerin toplamını yorumluyorum;
  • Sarnıç dünyada tek, bir haftadır dijital medyada Yerebatan sarnıcı açılacak haberlerinden dolayı seçtim, oradaki renkleri kullanmış.
  • Doom Slayer ile Yeniçeri 2. görselde oturmuş.
  • Birinci görselde Doom Slayer Medusa, Yeniçeriye karşı gibi.
  • 3. Görselde Medusa tanımlaması kimera olarak almış ancak orjinal heykele atıfta bulunuyor - Perseus'a.
  • 4. Görselde Medusa bir Leviathan'a biniyor gibi.
Ortamın puslu olması Blade Runner 2049, renkler Yerebatan bunları süper işlemiş; mitoloji, tarih ve dijital oyun konusunda o kadar da iyi tasvir yakalayamadı Dall-e. Orjinal görsel boyutları nedir?
 
Öncelikle bu deneyde kredini paylaştığın için teşekkür ederim.

Kesinlikle ilk görsel en güçlüsü.

Şimdi görsellerin toplamını yorumluyorum;
  • Sarnıç dünyada tek, bir haftadır dijital medyada Yerebatan sarnıcı açılacak haberlerinden dolayı seçtim, oradaki renkleri kullanmış.
  • Doom Slayer ile Yeniçeri 2. görselde oturmuş.
  • Birinci görselde Doom Slayer Medusa, Yeniçeriye karşı gibi.
  • 3. Görselde Medusa tanımlaması kimera olarak almış ancak orjinal heykele atıfta bulunuyor - Perseus'a.
  • 4. Görselde Medusa bir Leviathan'a biniyor gibi.
Ortamın puslu olması Blade Runner 2049, renkler Yerebatan bunları süper işlemiş; mitoloji, tarih ve dijital oyun konusunda o kadar da iyi tasvir yakalayamadı Dall-e. Orjinal görsel boyutları nedir?

Tavsiyelerin ve bu programa katılımın için ben teşekkür ederim :) Bu evrene pek hakim değilim. Ama yine de kısa bir cümle kurduğumuzu düşünüyorum. Betimlemeden yoksun bir cümle ile alabildiğimiz verim bu kadar gibi. Görselin orijinal boyutları 1024x1024, PNG formatında. Genelde görsel başına dosya boyutları 1,30 MB ile 2 MB arasında değişiyor.

Not: Technopat'a yüklenen görsellerin kalitesi, boyutu ve isimlerinde herhangi bir değişiklik olmuyor sanırım. Yani orijinali koruyan bir yapısı var.
 
Tavsiyelerin ve bu programa katılımın için ben teşekkür ederim :) Bu evrene pek hakim değilim. Ama yine de kısa bir cümle kurduğumuzu düşünüyorum. Betimlemeden yoksun bir cümle ile alabildiğimiz verim bu kadar gibi. Görselin orijinal boyutları 1024x1024, PNG formatında. Genelde görsel başına dosya boyutları 1,30 MB ile 2 MB arasında değişiyor.

Not: Technopat'a yüklenen görsellerin kalitesi, boyutu ve isimlerinde herhangi bir değişiklik olmuyor sanırım. Yani orijinali koruyan bir yapısı var.
Cümle sınırlaması veya örneklerine bakmakta fayda var, belki bağlı bir cümle yapısı yerine tek tek done vermek gerekiyor olabilir. Bunu yarın deneyelim mi biraz üzerine düşünüp?

1024x1024 png iyi gene, forumda 4mb sınırı vardı galiba.
 
Cümle sınırlaması veya örneklerine bakmakta fayda var, belki bağlı bir cümle yapısı yerine tek tek done vermek gerekiyor olabilir. Bunu yarın deneyelim mi biraz üzerine düşünüp?

1024x1024 png iyi gene, forumda 4mb sınırı vardı galiba.

Deneyelim tabii ki. Aslında bazen çok kısa cümlelerle de çok güzel görseller oluşturuyor. Tamamen o anki duruma bağlı. Mesela kredi sınırlaması olmasaydı bir kaç defa daha aynı cümleyi oluşturup daha detaylı inceleme fırsatı bulabilirdik. Bundan sonra waitlist başvurularımı bir kaç tane mail üzerinden yapmayı düşünüyorum :D

Ama bunun doğru bir davranış olmadığını düşünüp sonra vazgeçiyorum tabii. Başkalarının sırasını elinden almak doğru bir davranış değil. Sınırlı sayıda kullanıcıya açık bir program çünkü. GPT-3 başvurumda 15 günde sıra gelmişti. DALL-E başvurum 4 ay kadar sürdü.

Metin tabanlı yapay zeka GPT-3'ü deneyimledim. Görsel tabanlı DALL-E'yi de deneyimledim.

Şimdi sıra ses tabanlı Imitone'da ama tabi onun kullanımı $30'dan başlıyor. Efsane bir yapay zeka olduğunu düşünüyorum. (Fırsat bulursam bir gün satın alıp kullanacağım ama şuan mümkün görünmüyor.)

Tamamen insan sesini kullanarak ağızımızla çıkardığımız sesleri ve melodileri enstrüman seslerine çeviriyor ve ortaya harika müzikler çıkarmaya yarıyor. Kafandaki melodiyi hiçbir enstrüman bilgisine sahip olmadan gerçek bir müziğe dönüştürebilmek harika bir şey.

OpenAI bu konuda benzer bir proje üzerinde çalışıyor. Jukebox isimli bu proje bir ses tabanlı bir yapay zeka projesi ama işleyişi daha farklı sanırsam. Bu projede direkt olarak söylediğiniz şarkı sözlerine göre uygun melodiler üretiyor. Vokale fon müziği üreten bir yapay zeka denilebilir. (Benim anladığım kadarıyla böyle bir işleyişi var. Daha farklı bir çalışma prensibi de olabilir.)
 
Deneyelim tabii ki. Aslında bazen çok kısa cümlelerle de çok güzel görseller oluşturuyor. Tamamen o anki duruma bağlı. Mesela kredi sınırlaması olmasaydı bir kaç defa daha aynı cümleyi oluşturup daha detaylı inceleme fırsatı bulabilirdik. Bundan sonra waitlist başvurularımı bir kaç tane mail üzerinden yapmayı düşünüyorum :D

Ama bunun doğru bir davranış olmadığını düşünüp sonra vazgeçiyorum tabii. Başkalarının sırasını elinden almak doğru bir davranış değil. Sınırlı sayıda kullanıcıya açık bir program çünkü. GPT-3 başvurumda 15 günde sıra gelmişti. DALL-E başvurum 4 ay kadar sürdü.

Metin tabanlı yapay zeka GPT-3'ü deneyimledim. Görsel tabanlı DALL-E'yi de deneyimledim.

Şimdi sıra ses tabanlı Imitone'da ama tabi onun kullanımı $30'dan başlıyor. Efsane bir yapay zeka olduğunu düşünüyorum. (Fırsat bulursam bir gün satın alıp kullanacağım ama şuan mümkün görünmüyor.)

Tamamen insan sesini kullanarak ağızımızla çıkardığımız sesleri ve melodileri enstrüman seslerine çeviriyor ve ortaya harika müzikler çıkarmaya yarıyor. Kafandaki melodiyi hiçbir enstrüman bilgisine sahip olmadan gerçek bir müziğe dönüştürebilmek harika bir şey.

OpenAI bu konuda benzer bir proje üzerinde çalışıyor. Jukebox isimli bu proje bir ses tabanlı bir yapay zeka projesi ama işleyişi daha farklı sanırsam. Bu projede direkt olarak söylediğiniz şarkı sözlerine göre uygun melodiler üretiyor. Vokale fon müziği üreten bir yapay zeka denilebilir. (Benim anladığım kadarıyla böyle bir işleyişi var. Daha farklı bir çalışma prensibi de olabilir.)
Günaydın, başkalarının yaptığı görsel ve kelime/cümle setlerini görebiliyor musun Dall-e sayfasında? Onlardan örnek alabiliriz belki.

GPT-3'ler çok güzel şekilde Terminatöre bağlamaya çalışıyor, acayip gülüyorum.

Imitone'u incelemedim henüz, Auto-tune'un yaptığını müzik piyasasına yapmaya devam edecek gibi geliyor bana.

YZ'nin işlerimizi kolaylayan bir araç olarak gelimeşmesini istiyoruz hepimiz. Bazı işlerin ise kolaylanmaması daha iyi oluyor aslında. Meseleyi içine ruh katmak olarak görüyorum. :)
 
Günaydın, başkalarının yaptığı görsel ve kelime/cümle setlerini görebiliyor musun Dall-e sayfasında? Onlardan örnek alabiliriz belki.

GPT-3'ler çok güzel şekilde Terminatöre bağlamaya çalışıyor, acayip gülüyorum.

Imitone'u incelemedim henüz, Auto-tune'un yaptığını müzik piyasasına yapmaya devam edecek gibi geliyor bana.

YZ'nin işlerimizi kolaylayan bir araç olarak gelimeşmesini istiyoruz hepimiz. Bazı işlerin ise kolaylanmaması daha iyi oluyor aslında. Meseleyi içine ruh katmak olarak görüyorum. :)

Günaydınlar, evet başkalarının yaptığı cümle setlerini görebiliyor ve kendi oluşturduğumuz cümlelerimizi ve görsellerimizi DALL-E geliştiricileriyle paylaşabiliyoruz.

Örnek bir video hazırladım:
Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Ayrıca "Suprise me" butonu bulunuyor. Bu butona bastığımızda bizim yerimize YZ kendi kendine cümleler üretebiliyor.

Suprise me ile oluşturulan örnek bir cümle şu şekilde:

an astronaut lounging in a tropical resort in space, vaporwave

Ayrıca "Or, upload an image to edit" butonu da var. Buraya bir resim yükleyip üzerinde düzenleme yapabildiğimiz yazıyor ama hiç denemedim. Nasıl bir çalışma prensibi olduğunu da henüz bilmiyorum ama bugün öğrenmek niyetindeyim :)
 
Son düzenleme:
Günaydınlar, evet başkalarının yaptığı cümle setlerini görebiliyor ve kendi oluşturduğumuz cümlelerimizi ve görsellerimizi DALL-E geliştiricileriyle paylaşabiliyoruz.

Örnek bir video hazırladım:
Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Ayrıca "Suprise me" butonu bulunuyor. Bu butona bastığımızda bizim yerimize YZ kendi kendine cümleler üretebiliyor.

Suprise me ile oluşturulan örnek bir cümle şu şekilde:



Ayrıca "Or, upload an image to edit" butonu da var. Buraya bir resim yükleyip üzerinde düzenleme yapabildiğimiz yazıyor ama hiç denemedim. Nasıl bir çalışma prensibi olduğunu da henüz bilmiyorum ama bugün öğrenmek niyetindeyim :)

Feedback almayı otomatikleştirmişlerdir, eğer yorum ve kendi içinde beğen v.b butonu varsa - ki ben koyardım.

Video güzel olmuş, müziği biraz kısmam gerekti. :)
Arabirimde inanılmaz DARK UI Patterns yeteneklerini sonuna kadar kullanılmışlar. Yapılan işi tümüyle cici gösteriyor. Muhtemelen negatif/yasal olmayan durumlarla ilgili kelime süzgeçleri kullanmadılar, sonuçları göstermiyor olabilirler. Ya da sonuçlarla ilgili başka aksiyon alınıyordur.

Görsel yükleme konusunda Deep Fakeleri ( 😇 ) düşününce eh aşırı farklı bir durum olmayacaktır. Boş bir oda fotoğrafı yükleyip ikea objeleriyle doldurabiliriz belki. Nvidia YZ'yi görmüş müydün? Düz boyayıp belirtiyorsun, oradan yürüyor işte dağlar tepeler çiçekler dereler kuşlar v.b düzenliyor.

Peki statik görsel harici, statiği dinamik hale getirebilme gibi bir fikri var mı? Çubuk adam çiz desek, 64 kare sola koşsun ve zıplasın, bana 64 adet dizime hazır dosya verir mi?

Az sonra Dall-e ekibi gelir bizim foruma bu muhabbetlerden sonra.
 
Feedback almayı otomatikleştirmişlerdir, eğer yorum ve kendi içinde beğen v.b butonu varsa - ki ben koyardım.

Video güzel olmuş, müziği biraz kısmam gerekti. :)
Arabirimde inanılmaz DARK UI Patterns yeteneklerini sonuna kadar kullanılmışlar. Yapılan işi tümüyle cici gösteriyor. Muhtemelen negatif/yasal olmayan durumlarla ilgili kelime süzgeçleri kullanmadılar, sonuçları göstermiyor olabilirler. Ya da sonuçlarla ilgili başka aksiyon alınıyordur.

Görsel yükleme konusunda Deep Fakeleri ( 😇 ) düşününce eh aşırı farklı bir durum olmayacaktır. Boş bir oda fotoğrafı yükleyip ikea objeleriyle doldurabiliriz belki. Nvidia YZ'yi görmüş müydün? Düz boyayıp belirtiyorsun, oradan yürüyor işte dağlar tepeler çiçekler dereler kuşlar v.b düzenliyor.

Peki statik görsel harici, statiği dinamik hale getirebilme gibi bir fikri var mı? Çubuk adam çiz desek, 64 kare sola koşsun ve zıplasın, bana 64 adet dizime hazır dosya verir mi?

Az sonra Dall-e ekibi gelir bizim foruma bu muhabbetlerden sonra.

Beğen butonu olup olmadığını kontrol etmek için örnek görsellerden birinin üstüne tıkladım. Tabii ki orada "Click to Try" yazdığını bastıktan sonra hatırladım. Ama geç kalmıştım işlemi iptal edemedim :D
Daha önce oluşturulmuş örnek bir görseli tekrardan oluşturdu.

Evet video müziği konusunda bilgisayarımın ana ses seviyesini %50'de unuttuğum için videoda sesi yükseltmişim. %100 olacağına %150 seviyesinde olmuş :D

DALL-E politikalarına uymadığı gerekçesiyle uyarı aldığımız bir cümle oldu. Aslında çok da negatif değildi ve yasadışı da değildi. YZ'yi test etmek amacıyla kompleks bir cümle kurmaya çalıştık.

Cümlenin tam versiyonu şu şekildeydi:

A man with a islamic sword wearing a Ottoman attire, slippers and a British red hat that is wrestling with a Russian fat man with arabic attire that is drinking whisky at the end of a cliff with a view of the beach where there is russian bear and wolf fighting on red sand on a snowing day.

Ufak bir not: Google Translate ile Türkçeye çevirdiğimizde cümlede çok fazla anlam hatası oluyor. Kompleks bir cümle olduğu için çeviri saçmalıyor yani. Bu cümleyi hem İngiliz hem de Türk vatandaşlığı olan bir arkadaşım kurdu :)
Cümlede politika ihlali yaptığımız, DALL-E tarafından iddia edilse de ben öyle olduğunu düşünmüyorum.

WhatsApp Image 2022-07-23 at 13.23.15.jpeg


Bu olaydan sonra tabi politika ihlali yapan kelimeyi bulabilmek adına cümleyi değiştirip DALL-E'nin üzerine daha fazla gitmek istesek de hesabın askıya alınmasını istemediğimizden dolayı çok da kurcalamamayı seçtik.

Nvidia Omniverse ve Canvas Yapay Zeka teknolojilerini kullanmayı çok istiyorum ama bu teknolojileri kullanabilmek için RTX ekran kartına sahip olmak gerekiyor. Bu nedenle bu teknolojiler maalesef çok isteyip de kullanamadığım YZ teknolojilerinden bir kaç tanesidir.

Canvas ile basit usulde çizimler yaparak YZ yardımıyla harika görseller ortaya çıkarılabiliyor.
Ama burada asıl önemli olan teknolojinin Omniverse olduğunu düşünüyorum. Bu YZ ile teknolojide çığır açmışlar desek yeridir. Omniverse teknolojisini çok geniş çapta çok farklı alanlarda kullanabilirsiniz. Ama benim burada dikkatimi en çok çeken kısım Omniverse teknolojisinin GANverse 3D eklentisidir. Önceden kamerayla çekilmiş standart alan derinliği olan 2D bir fotoğrafı Omniverse'de bulunan GANverse 3D ile işleyerek 3D bir hale getirebiliyorsunuz.

Alttaki linkte örnek bir video ile olayı özetlemişler:

(Videoyu direkt "embed" olarak alamamak bence çok saçma olmuş. Paylaşmak istediğimiz zaman direkt döküman linkini vermemiz gerekiyor.)


NVİDİA geliştiricileri GANverse 3D dökümanlarında bu konu hakkında ufak bir özetleme yapmışlar.
NVIDIA, yaratıcıların arabaların fotoğraflarını çekmesine ve ışıklar, fizik modelleri ve PBR malzemeleriyle sanal kopyalar oluşturmasına olanak tanıyan bir Omniverse uzantısı olan GANverse3D'yi güçlendirmek için yapay zekayı kullanıyor.

Sanal varlıkları tek bir görüntüden yeniden oluşturmak inanılmaz derecede zor bir sorundur ve ortaya çıkan varlığın aslına uygunluğunu artırmak için sürekli olarak yeni fikirler keşfediyoruz. Mevcut AI modelimiz yalnızca sedanlar üzerinde açıkça eğitilmiştir, bu nedenle diğer araç türleri sedanlara dönüştürülecektir. Araştırma çalışmalarımız ilerledikçe, daha iyi araç çeşitliliği ve iyileştirilmiş kaliteli rekonstrüksiyonlar görmeyi bekliyoruz.

Ayrıca GANverse 3D eklentisi için bundan yaklaşık bir buçuk yıl önce son baktığımda çok harika render videoları vardı ama yaklaşık 2 saattir aramama rağmen o videolardan hiçbirini bulamadım. Normalde GANverse 3D'nin sadece arabalar üzerine değil bir çok obje üzerine eğitildiğini biliyordum. Ama son okuduğumda sanırım odak değiştirmişler.
Çok güzel render videoları vardı. Umarım ben bulamamışımdır :D

Omniverse ayrıca bir çok tasarım programının (oyun tasarımı, video, fotoğraf tasarımı yapılan programlar vb.) ortak olarak çalıştırılabileceği bir imkan ve ortam sağlıyor.
Unreal Engine, Photoshop ve 3DS Max'in aynı anda senkronize olarak kullanılabildiği bir ortamdan bahsediyorum.

Örnek video:
Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Talewords Entertaiments ile yaptıkları videolardan biri:
Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Audio2Face teknolojisi:
Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Bunlar Omniverse teknolojisinin yapabildiklerinin sadece bir kısmı. Aynı ortamda birden fazla kullanıcının senkronize olarak çalışması vb. bir çok özelliği bulunuyor. VR konularına falan da giriyor. Daha bir çok alanda çok geniş imkanlar sunan bir yapay zeka teknolojisi diyebilirim.

1024 piksel içerisine 64 kareyi sığdırarak dinamik bir görsel oluşturabileceğini düşünüyorum. Ama denemeden göremeyiz değil mi?

Dall-e ekibi gelirse hoş olur ama muhabbetimiz Türkçe dönüyor. Anlamakta güçlük çekebilirler :D
 
Tıklayınca aynısını mı oluşturdu yoksa tümüyle farklısını mı? Onu anlayamadım.

Eminim ancak kanıtlayamam: Cümlede "islamic" yerine "balsamic" yazsaydınız kurtarırdı. Tanımlama için "scimitar" yazıp islamic Sword'u bertaraf edebiliriz.

Bazı grupların YZ'lere 6-8 saat içerisinde sistem insanı gibi davranmayı öğrettiklerini düşünürsek, ağır önlemler paketi uygulamışlar.

NVIDIA Omniverse'i takip ediyorum, Cad uygulamalarından 2B uygulamalara kadar toplu çalışma, kolay geçiş sağlayacak bir altyapı (USD Collections) oluşturmaya çalışıyorlar.

40 yıldır herkes kendi programını satmak için alt yapılarını kilitlemişken kulağa güzel geliyor, her uygulamayı alabilirsiniz ve çalışabilirsiniz, sadece benim optimize ettiğim sistemleri kullanmanız şartıyla.

NVIDIA RayTracer modülünün suyunu çıkarttı, yeni 40XX serisi kartların yetişeceğini sanmıyorum. Biliyorsun videolarda genelde sistem bilgisi vermiyorlar, orada 50 dönüm arazide ege bamyası tadında GPU'lar söz konusu olabilir.

Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Bu içeriği görüntülemek için üçüncü taraf çerezlerini yerleştirmek için izninize ihtiyacımız olacak.
Daha detaylı bilgi için, çerezler sayfamıza bakınız.


Yalnız bu işi 2025'ten önce tamamlayabileceklerini sanmıyorum.

PNG yerine GIF çıktı verebiliyor olsa yapabilir, 1024/64 yapsak 16 kare verebilir, 4fps'den 4 saniyelik loop/döngü çıkar. En az Prince of Persia'nın orjinali kadar güzel olur.

Foruma gelirlerse Türkçe'nin günümüzdeki en ileri YZ için çok büyük problem olacağını tahmin ettiğim için sana hak verdim, vardır bir Türk aralarında, olmadı doktor çıkar. (Buraya bilinçaltı politik espiri gelsin.)

 

Technopat Haberler

Geri
Yukarı