Cunku AI gelistirme yaparken datayi zaten tek makinede process etmiyorsun. GPU'ya da cluster makinede big data isliyorsun. ( tensor, spark, pytorch vs )
Train sirasinda agir CPU gerektiren noktalarda r ya da Python uzerinden daha Low-seviye diller cagirildigi olsa da genelde veri islenirken limitleyen şey I/O islemleri oluyor.
Bu islemler sonucunda kullaniciya sundugun şey zaten hazir model oluyor, bu da zaten matris islemi yapiyor genelde yalnizca, o(1~n) islemler. Kullanicinin gordugu kisim burasi.
Ustelik scripting dili oldugu icin yazmasi ve dagitmasi basit. 3 satirda logreg yapiyorsun.
Memory problem degil, gelistirme yaparken zaten datanin subsetinde calisiyorsun. Gercek datayi isleyen cluster icin de Memory ve disk space zaten sorun degil.