Yerli yapay zeka kumru AI hakkında ne düşünüyorsunuz?

@TheAny Hayatımda ''ML ne, LLM ne'' diye bakmadığım doğrudur, bakmak için gerekte duyduğum bir şey değilmiş demek ki. Açıklarsan bilgi sahibi olmuş olurum belki.
Gercekten acik zihinle okuyacaksan anlatayim;

LLM'ler senin yazdigin seyi gercekten anlamiyorlar. Senin verdigin bir kelimeyi veya islemi karakter veya rakam olarak algilamiyor. Bir cumle yazdiginda, cumle once tokenize ediliyor. Bu cumle icerisindeki tokenlerin cikartilmasi demek.

Cikartilan tokenler daha sonrasinda matematiksel islemlerden gecerek context hesaplamasi yapiliyor ve bu contexte karsilik gelen istatistiksel veriyi sana toplayip geri getiriyor. Asiri yuzeysel anlatimi bu.

Bu noktada senin kelimenin icerigindeki harf sayisi vb seylerin LLM icin bi anlami yok. LLM bu tarz metadatalara sahip degil token haline getirdigi kelimeler hakkinda. O daha onceki tokenleri bi dizi matematiksel islemlerden gecirerek context weight cikardi ve bu context weight'e yaklasik karsilik gelen istatistiksel "cevabi" geri donduruyor.

Simdi bu yuzeysel olarak nasil yanit aldigin. LLM egitilirken verilen veri seti LLM'in dogal dil akisini anlamasina yardimci olur. LLM bu noktada dogal dil akisi hakkinda yeterince istatistiksel veriye sahiptir ancak dogru context build edebilmesi icin fine tuning ve pekistirmeli ogrenmeye ihtiyaci vardir. Peki nede?

Cunku LLM buraya kadar geldiginde yonlendirme almamis yada yeterince yonlendirme almamistir. Supervised bi egitim methodu ciddi donanim gerektirir genelde. Ellerinde bu tarz bir donanima erisim olmadigini adamlarin model boyutlarindan anlayabilirsin. 2b extra-mini modellerdir genelde, 7b ise mini model olarak gecer. Ornek olmasi icin GPT-OSS'nin son kullanici hazir versiyonu 117 milyar parametreye sahip. Kumra ise sadece 7 milyar.

Illa donanim erisimi eksikliginden olmak zorunda degil. Vakit, para vb etmenlerde var ama ozetle, asiri kucuk.

Parametre sayisi yine yuzeysel olarak, bi modelin ne kadar fazla data arasinda iliski kurabilecegini belirleyen deger diyebiliriz.

LLM modelleri asiri kompleks matematiksel hesaplamalar yapan ve yaptigi hesaplamalari bir istatistiksel haritalamadan gecirip bu haritalamadan buldugu verileri geri yine bi seri yaptigi hesaplamalar ile dogal dil akisina ceviren bi sistem diyebiliriz ve bu matematiksel hesaplamalar sirasinda model bu tarz contextleri kaybedecek.

Peki pekistirmeli ogrenme ne ve nasil bu sorunu cozmeye yardimci oluyor? Pekistirmeli ogrenme tek basina bu sorunu cozmuyor. Bunun en net ornegi GPT-4o idi. GPT-4o matematiksel islemleri Python uzerinde yapmadiginda israrla sacmaliyor, azicik kompleks islemler gordugunde tamamen random degerler veriyordu. Cunku islemi gercekten nasil yapacagini bilmiyor, build ettigi context'e en yakin karsilik gelen yaniti veriyordu. Gormedigi degerleri anlamadigi matematiksel islemlerden geciremiyordu.

GPT-4o ayni zamanda bi kelimedeki harfleri de sayamiyordu. Matematiksel islemlerin basit varyasyonlarini bir supervisor ile (bu insan olabilir veya yanitlari onceden belirli otomasyon supervisorlar olabilir) LLM'e duzeltip yeniden besliyorlar. Ayni sekilde bu tarz islemleri kelimeler icin de yapiyorlar. Bunun sayesinde LLM bu tarz sorular arasinda daha dogru baglam kurabiliyor. Ancak her zaman bu baglam kusursuz olmuyor.

Bu noktada chain-of-thought modelleri ve M-LLM'ler devreye giriyor. M-LLM'ler bu tarz islemleri kendileri dogrudan kendi egitimleri uzerinden yanitlamak yerine, bunu yanitlayabilecek agentlari cagirip yanitliyorlar. Chain of thought modelleri once bi sonraki asamayi nasil yapmasi gerektigini belirliyor, gerektiginde farkli agentlara is buyuruyor, gerektigindeyse minimize ettigi tokenlerle daha dogru yanitlar veriyor.

Bi forum yazisina gecenin bi vakti sigdirabilecegim en yuzeysel anlatim bu. Bundan daha fazlasini yapamam. Daha fazlasi ilginizi cekerse arastirmanizi siddetle tavsiye ederim. Elestirinin dozunu belirlemenize de yardimci olur.

Musait bi zamanda ek kaynak da paylasirim eger merak ediyorsan ve daha fazla arastirmak istersen.

Machine learning biliyorum da hocam yapay zekanın cevaplar koparttı. İlerde düzelir elbet.
Komik gelebilir, bunu elestirmiyorum. Bazi yanitlari bence de asiri komik. Ama elestirinin dozunu, duzeyini kacirmak farkli bi sey. Yok cop, yok para israfi, yok cok sacma, yok geri zeka benzeri yorumlar elestirinin dozunu kacirmak oluyor.

Pardon, eğitilememiş zira bu modelden 2+2’nin cevabını bile doğru alamazsınız.
Sen bari yapma... 2+2'nin cevabinin egitilememis olmasindan kaynaklandigini mi dusunuyorsun gercekten? 🤦‍♂️

Yanli olmasini elestirmek farkli -ki ben tamamen mantiksiz bulmuyorum, sonra diktatorun birine sovdu diye hem islerinden, hem ozgurluklerinden olurlar mazallah- 2+2'yi elestirmek farkli.
 
Son düzenleme:
@TheAny Öncelikle eline sağlık diyorum çünkü hakkını vererek yazmışsın. Ben bu işlerden anlamam, anlattıklarından az çok bir şey anladım, yeterli olduğunu düşünüyorum. :)

Bizim eleştirdiğimiz kısım, en basit şeylere bile cevap verememesiydi aslında. Bu saydıklarından kaynaklanıyorsa bilemeyeceğim, yine de bana saçma geliyor. Dalgasına bakıyoruz işin, bence abartılacak bir şey yok ortada.
 
Baştan aşağı fiyasko. Yaptıkları açıklama daha da fiyasko. Biz zaten Kumru' nun ChatGPT olmasını beklemedik. Çalışmasını bekledik. Hiç kimse kusura bakmasın. Bu bir yapay zeka değil. Sanırım yapay zekadan anladıkları farklı bir şey. Lütfen gerçekçi olalım. Piyasadaki AI hizmeti veren şirketlerin yapabildiklerine her geçen gün şaşırırken bu saçma sapan 4 işlem dahi yapmayan siteyi bizlere yapay zeka diye sunarken düşüneceklerdi. Yandaş basın bunu ChatGPT ye altarnatif olarak haber yaptı. Bu bizle alay etmektir. Bu işi bu ülkede yapacak çok fazla zeki insanlar var. Kimlere imkan veriliyor ?
 
Baştan aşağı fiyasko. Yaptıkları açıklama daha da fiyasko. Biz zaten Kumru' nun ChatGPT olmasını beklemedik. Çalışmasını bekledik. Hiç kimse kusura bakmasın. Bu bir yapay zeka değil. Sanırım yapay zekadan anladıkları farklı bir şey. Lütfen gerçekçi olalım. Piyasadaki AI hizmeti veren şirketlerin yapabildiklerine her geçen gün şaşırırken bu saçma sapan 4 işlem dahi yapmayan siteyi bizlere yapay zeka diye sunarken düşüneceklerdi. Yandaş basın bunu ChatGPT ye altarnatif olarak haber yaptı. Bu bizle alay etmektir. Bu işi bu ülkede yapacak çok fazla zeki insanlar var. Kimlere imkan veriliyor ?
Screenshot_20251014-001016_Chrome.png
 
Kimlere imkan veriliyor ?
Adamlarin devlet girisimi olduğunu nereden cikardiniz? VNGRS adli, BtcTurk tarafindan satin alinmis ozel bir firma. Ozel bir girisim.
Piyasadaki AI hizmeti veren şirketlerin yapabildiklerine her geçen gün şaşırırken bu saçma sapan 4 işlem dahi yapmayan siteyi bizlere yapay zeka diye sunarken düşüneceklerdi. Yandaş basın bunu ChatGPT ye altarnatif olarak haber yaptı.
Elestirinin dozunu kacirmak dediğim mevzu tam burda basliyor iste. Piyasada AI hizmeti veren sirketlere bir alternatif degil. Hakkinda kismini acip okursaniz gorursunuz. Yine kendileri kalkip bitmis bir urun olarak sunmadilar bunu kimseye. Acip hakkinda kismini ve medium blogunu okursaniz bunun bir demo oldugunu, daha gececegi pek cok asama oldugunu, modelin yapmaya calistigi/doldurmaya calistigi pozisyonu goreceksiniz.

Kendi PR calismalari Turkce oldugu uzerine. Yandas medyanin ne dediği önemli degil. Elestirinin, eleştiri olmayi birakip, saldiriya donustugu o noktadasiniz.
 
Sen bari yapma... 2+2'nin cevabinin egitilememis olmasindan kaynaklandigini mi dusunuyorsun gercekten? 🤦‍♂️

Yanli olmasini elestirmek farkli -ki ben tamamen mantiksiz bulmuyorum, sonra diktatorun birine sovdu diye hem islerinden, hem ozgurluklerinden olurlar mazallah- 2+2'yi elestirmek farkli.
Yanlis anlasilma olmus, 2+2 nin cevabini dogru alamamak ornegi yanlis olmus. Simdi kontrol ederken fark ediyorum. Objektif olmayisindan kaynakli olarak "2+2 yi bile isine geldigi gibi soyler" gibi bir ithamda bulunmak istemistim. Zira twitterda bir ekran goruntusuyle beraber bu minvalde bir sey yazmistim. Buraya uyarlarken onceki baglam olmadigi icin havada kalmis.
 
Tamamen yerli olduğunu kanıtladı ama. İyi bir yapay zeka olsaydı DeepSeek'in kaynak kodlarını kullanmışlar derdim.
 

Technopat Haberler

Yeni konular

Geri
Yukarı