Hocam bu yazıyı okudunuz mu?
Kumru hakkında.
Geri dön.
Kumru bir ChatGPT alternatifi değildir. Son kullanıcıya yönelik değil kurum içi senaryolar için aktif olarak geliştirilmektedir. Henüz versiyon 0.2.1'dir ve şu an için yetkinlikleri sınırlıdır. Bu sayfa Kumru'yu sadece denemek için hazırlanmış bir arayüzdür, ürünün kendisi değildir. Sonuçları güncel değildir, kontrol etmeden çıktılara güvenmeyiniz.
Kumru, vngrs tarafından Türkçe için sıfırdan geliştirilmiş ve eğitilmiş ilk temel dil modelidir. 7.4 milyar parametreye sahiptir. Zengin ve güncel kaynaklardan beslenen 500 GB'lık temizlenmiş, tekilleştirilmiş bir veriseti ile 300 milyar token eğitilen model 8,192 token'lık bir context Length'e sahiptir. Tokenizer'ı da Türkçe için sıfırdan eğitildiği için verilen metni tokenize ederken llama-3, GPT-4o gibi multilingual Tokenizer'lara göre %40 ile %90 arasında daha az token harcar. Bu yüzden de efektif olarak 12K'ya yakın bir context Length'e sahiptir. Cetvel Türkçe llm benchmark'ında llama-3.3-70b, qwen-2-72b, gemma-3-27b, AYA-32b gibi kendisinden çok daha büyük açık kaynak modellerden daha yüksek skorlar almıştır. Model, verimliliği sayesinde 16 GB VRAM'e sahip GPU'larda quantization gibi tekniklere gerek duyulmaksızın kurum içi yerinde kullanıma uygundur.