14 yaşında, sıfırdan Türkçe yapay zeka modeli geliştirme adımları

Merhaba Technopat ailesi,
Ben Ömer Efe, 14 yaşındayım.

Bu konuyu açmamdaki amaç; yalnızca bir yapay zeka geliştirmek değil, aynı zamanda Türkiye'de bir gencin sıfırdan neler yapabileceğini göstermek. Türkiye'nin kendi dilinde, kendi altyapısıyla, yerli ve bağımsız bir yapay zeka modeli olabilir mi sorusuna cevap aramak istedim. Ve bu soruya kendi imkânlarımla bir cevap üretmeye çalıştım.

Neden bu projeye başladım?​


Bugün kullandığımız GPT, claude, Gemini gibi yapay zekâların hepsi yabancı şirketlere ait. Ben de “neden biz de kendi Türkçe yapay zekâmızı yapmayalım?” dedim. Hazır modelleri alıp kullanmak yerine, sıfırdan kendi verimi toplayıp işledim ve modelimi eğittim. Ne bir laboratuvarım vardı ne de güçlü sunucularım. Sadece 400GB boş alanı olan bir dizüstü bilgisayarım ve çok büyük bir hayalim vardı.

Neler yaptım?​


  • Huggingface gibi kaynaklardan 110GB'tan fazla Türkçe veri indirdim.
  • Bu verileri temizledim, doğruladım ve parçalara ayırdım.
  • Python ile script hazırlayarak tüm süreci otomatikleştirdim.
  • Verileri işlerken log tuttum, zaman damgaları, kaynak URL'leri gibi detaylara kadar her şeyi belgeledim.
  • Daha sonra elimdeki verinin bir kısmı ile küçük bir model eğittim
  • Eğitim sırasında, veriyi indirme, veriyi işleme kısımları için kendi bilgisayarımı günlerce açık tutmak zorunda kaldım. Sıcaklıklar, donmalar, hatalar yaşadım ama devam ettim.

Zorluklar​


  • Güçlü donanımım yoktu. Eğitim çok yavaş oldu.
  • Model saçma cevaplar verdi bunun sebebi ise küçük bir model oluşturmamdı çok büyük veriler ile eğitemedim.
  • Sunucu bulamadım, ücretsiz platformlarla uğraştım ama çoğu ya sınır koydu ya da destek vermedi.

Elimde ne var?​


  • Kendi ellerimle indirdiğim ve işlediğim temiz Türkçe veri seti.
  • Eğitim logları, ekran görüntüleri ve Python scripti.
  • Tamamen sıfırdan eğitilmiş küçük ama yerli bir Türkçe dil modeli.

Neden bu konuyu açtım?​


Ben bu modeli “süper cevaplar versin” diye değil, bir hayal gerçekleşebilsin diye geliştirdim. Belki şu an GPT-4 kadar değil ama bu yolun başı. Eğer sesimi duyurabilirsem, belki bu alanla ilgilenen diğer gençler için de bir umut olur.
Destek almak, öneri duymak, yol gösterecek insanlar bulmak ve en önemlisi “bu ülkede teknoloji üretilebilir” demek için buradayım.

Log dosyaları veri indirmek için Python dosyası ve Türkçe model için:

 

Dosya Ekleri

  • Ekran görüntüsü 2025-05-03 095734.png
    Ekran görüntüsü 2025-05-03 095734.png
    158,3 KB · Görüntüleme: 112
  • Ekran görüntüsü 2025-04-27 100735.png
    Ekran görüntüsü 2025-04-27 100735.png
    26,4 KB · Görüntüleme: 114
  • Ekran görüntüsü 2025-05-01 231155.png
    Ekran görüntüsü 2025-05-01 231155.png
    163,3 KB · Görüntüleme: 111
Son düzenleyen: Moderatör:
Merhaba! Proje nasıl gidiyor? Şahsen uzun zamandır aklımda olan bir yapayzeka model fikri vardı seninle paylaşmak istedim. Yakın zamanda internette ABD'deki bir adamın ChatGPT kullanarak finans yatırımları yaptığını ve bundan %20'ye yakın karlılık elde ettiğini görmüştüm, bunu Gemini, ChatGPT ile yapmayı denediğimde sonuç hep hüsran oldu çünkü Türk borsası'na günümüz AI'ları alışkın değil ve bende düşündüm fine tuning ile Gemini'ye Türk borsasıyla alakalı veri setlerini yükledim ve çok daha tutarlı sonuçlar vermeye başladı. Bunu gördükten sonra kendi modelimi geliştirmeye çalıştım ama bazı nedenlerden ötürü veri setlerini birleştiremeden çeşitli nedenlerden ötürü projeden vazgeçtim ve şimdi görüyorum ki aynı yaş skalasında olduğumu gördüğüm sende benimle benzer bir ideale koşuyorsun senden tek isteğim bu idealini gerek kendin için gerek geleceğin için devam ettir inanıyorum ki başarılı olacaksın.
merhaba uzun zamandır technopat girmediğim için yazdığın mesajı görmemişim bende hala bu konuların üzerinde devam ediyorum konuyu ilk açtığımdan yana şuana kadar kendim 0 dan çıkardığım modelin boyutu artık 115mb 30M parametreli ancak daha büyüğünü çıkarmayı düşünüyorum bunu deneme amaçlı yapmıştım çok iyi olduğunu söylüyemem veri seti konusunda c4 verisi ve oscar verisi üzerinde çalıştım şunu söylüyebilirim tüm veri setini kullanmak yerine temizleme yapmıştım toplam 300gblık verinin içerisinden sadece 35gb lık veri çıkarabildim bu eğitim sırasında veri kalitesi elbette çok önemli veriyi temizlemeden ne kadar büyük model yapmaya çalışırsan çalış sonuç hep kötü olucak saçmalıyacak ama fine tune kısmına gelince senin o modele verdiğin veri model kendi verisini ekliyerek cevabı değişiyor yani komple senin verdiğin veri seti yerine kendi cevabısına o veriyle ekleme yaparak cevap veriyor
 

Technopat Haberler

Geri
Yukarı