BlazingSQL Artık Açık Kaynak Kodlu

In Makale by Egemen YıldızLeave a Comment

GPU hızlandırmalı BlazingSQL’in sunduğu yenilikleri ve avantajları bu yazımızda bulabilirsiniz.

BlazingSQL; RAPIDS ekosistemi altındaki GPU-hızlandırma özelliğine sahip bir SQL motorud. RAPIDS ekosistemi altındaki açık kaynak kodlu yazılımlar, büyük verilerin işlenmesini GPU’lar yardımıyla hızlandırmayı amaçlıyor. BlazingSQL de bu ekosisteme katılarak Apache 2.0 lisanslı altında tamamen açık kaynak kodlu hale geldi.

BlazingSQL; bir veri tabanı olmadığı için programın orijinal ismi olan BlazingDB, BlazingSQL olarak değiştirildi. BlazingSQL, neredeyse tüm istediğiniz verileri işleyecek bir SQL motoru. Program RAPIDS ekosistemine katılarak iş dünyasında önemli görevler üstlenen 100’den fazla geliştiriciden de faydalanacak. BlazingSQL’e yeni özellikler ve daha çok dosya formatı desteği sağlanacak. Üstelik geliştirme süreci hızlanarak daha çok kullanıcıya da ulaşılacak.

NVIDIA da veri bilimi için yeni nesil veri merkezlerini kuruyor. RAPIDS projesi de bu yeni hareketten faydalanıyor ve BlazingSQL’i, veri bilimi için kullanılan GPU SQL motorlarının standardı haline getiriyor. BlazingSQL’in açık kaynak kodlu hale getirilmesi de NVIDIA ile olan ortak stratejinin sonucunda ortaya çıktı.

NVIDIA, müşterilerinin sorunlarını ölçeklenebilir bir şekilde çözmek istiyor. BlazingSQL, RAPIDS ile birlikteliğinin başarılı ve herkes tarafından erişilebilir bir çözüm olması için gerekli hizmetleri ve destek anlaşmalarını sunmaya odaklanacak.

Müşterilerin Sorunları

Müşterilerin sorunları dinlendiği zaman, genellikle verileri ölçeklenebilir bir şekilde işlemenin; pahalı, yavaş ve çok karmaşık olduğu ifade edilir.

  • Pahalı : Müşteriler genellikler binlerce sunucuyu veri bilimi için bir araya getirerek ölçeklenebilirliği sağlıyor. BlazingSQL ile birlikte RAPIDS ise eşdeğer ölçeği çalıştırmak için bunun yalnızca bir kısmına ihtiyaç duyuyor.
  • Yavaş : Büyük veri setlerini işlemek çok iş yükü gerektirdiğinden saatler hatta günler alabiliyor. BlazingSQL ile birlikte RAPIDS ise GPU-hızlandırma çözümü sunarak saniyeler içinde sonuç alınmasını sağlıyor. Böylelikle veri bilimciler yeni modeller üzerinde hızlı şekilde çalışabiliyor.
  • Karmaşık : İş yükleri genelde küçük bir ölçekte deneniyor ve daha büyük sistemler için yeniden oluşturuluyor. BlazingSQL ile birlikte RAPIDS ise kullanıcıların kodu tek bir seferde yazmasını ve tek satır kodla dinamik olarak ölçekleyebilmesini sağlıyor.

BlazingSQL; müşteri endişelerini hızlı ve basitliğe odaklı bir GPU SQL motoru ile çözmeye çalışıyor. SQL, bugüne kadar veri analizi yapan her sistemin temelini oluşturuyor. RAPIDS’in SQL standardı da BlazingSQL’dir. Bunun için BlazingSQL, tamamen cuDF ve cuIO üzerine kuruldu. Bu projelerdeki yeni özellikler BlazingSQL’in özelliklerine ve performansına direkt olarak etki edecek.

BlazingSQL, RAPIDS kullanıcılarına birçok fayda sağlıyor. Kod karmaşıklığını azaltarak yüzlerce fonksiyonu tek bir ifade ile değiştirmek mümkün hale geliyor. Üstelik BlazingSQL, bulut ya da ağ dosya sisteminizde yer alan ham dosyaları işleyebiliyor. Böylelikle diğer veri tabanları ile eşitleme yapmak zorunda kalmıyorsunuz. Gelişmiş SQL optimizasyonu sayesinde de RAPIDS daha hızlı hale geliyor.

Tüm proje de açık kaynak kodlu hale geldiği için geliştiricilerin BlazingSQL ile çalışması ve sorunlarını gidermeye yardımcı olması teşvik ediliyor.

BlazingSQL’in kodlarına bu Github sayfasından ulaşabilirsiniz.