Rehber BLAS nedir?

300319 · 2 Temmuz 2024

Bu işi bitirmişsin Bora

Phonica · 2 Temmuz 2024

Elinize sağlık. Son zamanlarda okuduğum en tatmin edici Türkçe yazıyı okudum diyebilirim. Ufak bir hata var, izninizle düzeltmek isterim:

Fortran esasında pek low-level olarak geçmiyor. Zamanında çok fazla bilimsel formül Fortran ile yazıldığı için bir dönem matematiğin hesaplama dili gibi bir konuma erişiyor. Derlenen bir dil olduğu için doğası gereğince hızlı ancak low-level operasyonlar pek yok.

Bora Dere · 2 Temmuz 2024

Phonica dedi:
Elinize sağlık. Son zamanlarda okuduğum en tatmin edici Türkçe yazıyı okudum diyebilirim. Ufak bir hata var, izninizle düzeltmek isterim:

Fortran esasında pek low-level olarak geçmiyor. Zamanında çok fazla bilimsel formül Fortran ile yazıldığı için bir dönem matematiğin hesaplama gibi bir konuma erişiyor. Derlenen bir dil olduğu için doğası gereğince hızlı ancak low-level operasyonlar pek yok.

Haklısınız, low-level olarak tanımlamak hatalı kaçıyor. Teşekkür ederim, düzeltiyorum.

bitwise · 2 Temmuz 2024

Cok guzel guide olmus.

Python'in 1m iterasyonu 500 saniyede yapmasina sasirip kendi makinemde denedim sabredemeyip kapattim. Omur torpusu gercekten. C'de yazsan muhtemelen 2ms surmeyecek. Meraklisi deneyip sonucu yazsa super olur, non-scientific benchmark keyifli is.

brkdnmz · 2 Temmuz 2024

Elinize sağlık.

İlk örnekte süre farkının çok fazla olması, Python testinde sayıların sınırlandırılmayıp (int) NumPy testinde 64 bit ile (np.int64) (?) sınırlandırılmış olmasından kaynaklı. Bunun göstergelerinden biri, NumPy testinde çarpımın sonucunun 0 gelmesi. İlk kez 66!'de 0 olmasından yola çıkarak testte 64 bit ile çalıştığını tahmin ettim.

Python, pahalı işlemler yapmaya daha ilk adımlardan başlıyor ve sonuç bu şekilde oluyor. Benim bilgisayarımda da bayağı uzun sürüyor.

Python testini de NumPy'ınkine şu şekilde benzetmeye çalıştım:

Python:

import time
from ctypes import c_int64

import numpy as np

c = 1
st = time.time()

for i in range(1, 1_000_000 + 1):
    c = c_int64(c * i).value

et = time.time()

print(f"Tüm işlem {(et - st):.2f} saniye sürdü.")

Kod:

Tüm işlem 0.09 saniye sürdü.

NumPy versiyonunda da 0.94 saniyeyi gördüm bilgisayarımda. İki versiyonda da döngü kullanılıyorken Python öne geçmiş oldu. Döngü yerine np.prod(range(1, 10**6 + 1)) kullanınca 0.04'e düştü bu süre. Sınırı, ikinci örnekteki gibi 10**8'e çıkarınca fark daha da açılıyor tabii NumPy lehinde.

İkinci örnekte de NumPy'da döngü içinde np.dot kullanılınca Python versiyonundan daha yavaş olduğu gözlemlenebiliyor. Tabii bu da döngülerden kaçınıp olabildiğince NumPy'dan yararlanmaya teşvik ediyor.

BLAS'ın yanı sıra NumPy'ın C'den faydalanıp Python'un kendi for döngüsü nedeniyle oldukça yavaş kalması da bir etkendir diye tahmin ediyorum.

Şu C++ testi, bilgisayarımda -O2 optimizasyon flagiyle 0.065 ve flagsiz 0.180 saniyede çalışıyor:

C++:

#include <bits/stdc++.h>
using namespace std;

int main() {
    const int N = 1e8;
    vector<long long> v(N), w(N, 1);
    for (int i = 0; i < N; i++) {
        v[i] = rand() % 11;
    }
    long long sum = 0;
    auto st = chrono::steady_clock::now();
    for (int i = 0; i < N; i++) {
        sum += v[i] * w[i];
    }
    auto en = chrono::steady_clock::now();
    cout << chrono::duration_cast<chrono::milliseconds>(en - st).count() / 1e3 << " " << sum << "\n";
}

Tabii 0.33 değerinde Python'un bir etkisi vardır kesin.

bitwise · 3 Temmuz 2024

brkdnmz dedi:
Elinize sağlık.

İlk örnekte süre farkının çok fazla olması, Python testinde sayıların sınırlandırılmayıp (int) NumPy testinde 64 bit ile (np.int64) (?) sınırlandırılmış olmasından kaynaklı. Bunun göstergelerinden biri, NumPy testinde çarpımın sonucunun 0 gelmesi. İlk kez 66!'de 0 olmasından yola çıkarak testte 64 bit ile çalıştığını tahmin ettim.

Python, pahalı işlemler yapmaya daha ilk adımlardan başlıyor ve sonuç bu şekilde oluyor. Benim bilgisayarımda da bayağı uzun sürüyor.

Python testini de NumPy'ınkine şu şekilde benzetmeye çalıştım:

Python:

import time from ctypes import c_int64 import numpy as np c = 1 st = time.time() for i in range(1, 1_000_000 + 1): c = c_int64(c * i).value et = time.time() print(f"Tüm işlem {(et - st):.2f} saniye sürdü.")

Kod:

Tüm işlem 0.09 saniye sürdü.

NumPy versiyonunda da 0.94 saniyeyi gördüm bilgisayarımda. İki versiyonda da döngü kullanılıyorken Python öne geçmiş oldu. Döngü yerine np.prod(range(1, 10**6 + 1)) kullanınca 0.04'e düştü bu süre. Sınırı, ikinci örnekteki gibi 10**8'e çıkarınca fark daha da açılıyor tabii NumPy lehinde.

İkinci örnekte de NumPy'da döngü içinde np.dot kullanılınca Python versiyonundan daha yavaş olduğu gözlemlenebiliyor. Tabii bu da döngülerden kaçınıp olabildiğince NumPy'dan yararlanmaya teşvik ediyor.

BLAS'ın yanı sıra NumPy'ın C'den faydalanıp Python'un kendi for döngüsü nedeniyle oldukça yavaş kalması da bir etkendir diye tahmin ediyorum.

Şu C++ testi, bilgisayarımda -O2 optimizasyon flagiyle 0.065 ve flagsiz 0.180 saniyede çalışıyor:

C++:

#include <bits/stdc++.h> using namespace std; int main() { const int N = 1e8; vector<long long> v(N), w(N, 1); for (int i = 0; i < N; i++) { v[i] = rand() % 11; } long long sum = 0; auto st = chrono::steady_clock::now(); for (int i = 0; i < N; i++) { sum += v[i] * w[i]; } auto en = chrono::steady_clock::now(); cout << chrono::duration_cast<chrono::milliseconds>(en - st).count() / 1e3 << " " << sum << "\n"; }

Tabii 0.33 değerinde Python'un bir etkisi vardır kesin.

sum degerini looptan sonra kullanmazsan sonuc nasil degisiyor?
compiler unused variable ilan edip optimize edecek mi onu merak ediyorum.

brkdnmz · 3 Temmuz 2024

bitwise dedi:
sum degerini looptan sonra kullanmazsan sonuc nasil degisiyor?
Compiler unused variable ilan edip optimize edecek mi onu merak ediyorum.

O2'de optimize ediyordu ve süre sıfır geliyordu, tam olarak bu yüzden yazdırmıştım. : )

Rehber BLAS nedir?

Ayrıntılı düzenleme

numpy.dot — NumPy v1.25 Manual

OpenBLAS/lapack-netlib/BLAS/SRC/ddot.f at develop · OpenMathLib/OpenBLAS

Peki, nedir BLAS?

Level 1

Level 2

Level 3

Basic Linear Algebra Subprograms - Wikipedia

300319

Zettapat

Phonica

Picopat

Bora Dere

Moderasyon Ekibi Üyesi

bitwise

Gigapat

brkdnmz

Megapat

bitwise

Gigapat

brkdnmz

Megapat

Benzer konular

Technopat Haberler

Yeni konular

Yeni mesajlar

Gizliliğinize önem veriyoruz

Rehber BLAS nedir?

Peki, nedir BLAS?​

Level 1​

Level 2​

Level 3​

Zettapat

Picopat

Moderasyon Ekibi Üyesi

Gigapat

Megapat

Gigapat

Megapat

Benzer konular

Technopat Haberler

Gizliliğinize önem veriyoruz

Peki, nedir BLAS?

Level 1

Level 2

Level 3