Teknoloji Dünyasını Sarsan Yapay Zeka: DeepSeek Nedir?

Ticaret savaşları, büyük yatırımlar ve kısıtlamalar derken her geçen başka bir haberle uyanıyoruz. Bu sefer gündeme oturan öyle büyük bir haber var ki, tüm dünya bu yapay zeka platformunu konuşuyor. Hatta Çin’den çıkan bu AI girişimi, dünya devi teknoloji şirketlerinin hisselerini bir gün yerle yeksan etti: Yüksek ihtimalle duymuşsunuzdur, DeepSeek’ten söz ediyoruz.

Yapay zeka endüstrisini kasıp kavuran DeepSeek, OpenAI, Google ve Meta gibi devlerin sunduğu yapay zeka performansını çok daha düşük maliyetlerle sunabiliyor. Çok daha verimli ve AI modellerinin eğitim masrafları çok daha düşük. Yani DeepSeek’i bu kadar özel kılan şey, ChatGPT gibi endüstri lideri modellere kıyasla çok daha düşük maliyetlerle inşa edilmesi. Bu bağlamda çok daha az donanım ve çiple güçlü yapay zeka modelleri geliştirilebiliyor.

Deepseek’in V3 ve R1 modelleri hakkında bilmeniz gereken her şeyi ve şirketin neden Amerika’nın hedeflerini temelden sarsabileceğini konuşacağız.

DeepSeek Nedir?

DeepSeek, Nisan 2023’te ana şirketi High-Flyer için bir yapay zeka laboratuvarı olarak kurulan Çinli bir yapay zeka girişimi. Şirketin tam ismi ise Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. şeklinde.

Mayıs ayında DeepSeek kendi başına bir şirket (High-Flyer yatırımcı olarak kaldı) haline geldi ve DeepSeek-V2 modeli tanıtıldı. V2, ByteDance, Tencent ve Baidu gibi diğer önde gelen Çinli yapay zeka firmalarıyla aynı seviyede performans sunuyordu, ancak çok daha düşük bir işletme maliyeti vardı.

Şirketin ismi böyle lakin teknoloji dünyasında modellerin ismi de “DeepSeek” olarak lanse ediliyor. Basit bir tabirle DeepSeek, “çıkarım zamanlı hesaplama” olarak bilinen ve “her sorgu için modellerin ilgili kısımlarını kullanan” açık kaynaklı büyük bir dil modeli. Bu sayede maliyet ve hesaplama gücünden tasarruf sağlanabiliyor.

Neler Yapabiliyor?

DeepSeek, sohbet robotları ChatGPT, Gemini ve Claude’un yapabildiği her şeyi yapabiliyor. Buna metin, ses, görüntü ve video oluşturma da dahil.

Dahası, DeepSeek’in Janus Pro olarak adlandırılan yeni çok modlu model ailesinin, bir çift endüstri kıyaslamasında DALL-E 3’ün yanı sıra PixArt-alpha, Emu3-Gen ve Stable Diffusion XL’den daha iyi performans gösterdiği bildiriliyor. o1’e rakip olan DeepSeek-R1, karmaşık muhakeme görevlerini yerine getirmek için özel olarak tasarlanmış olup, sorunlara adım adım çözümler üretmekte ve bir sorunu çözerken muhakeme sürecini adım adım açıkladığı “mantıksal düşünce zincirleri” oluşturabilmekte.

Özetle, Çin merkezli DeepSeek’in sunduğu yapay zeka ile bugüne kadar konuştuğumuz neredeyse her şeyi yapabiliyoruz. Bazı şeyler hariç olmak kaydıyla. DeepSeek hizmetlerinin yapamadığı şeylerden biri Tienanmen Meydanı hakkında konuşmak. Ya da Sarı Şemsiye protestoları. Ya da Başkan Xi Jinping’in Winnie the Pooh’ya olan benzerliği. Temel olarak, Çin Komünist Partisi tarafından yasak kabul edilen bir konu ise, DeepSeek’in sohbet robotları bu konuyu ele almayacak veya anlamlı bir şekilde etkileşime girmeyecek.

Kimler Kullanabilir? Ücretsiz mi?

Açık kaynaklı bir LLM (Büyük Dil Modeli) olarak DeepSeek’in modeli herhangi bir geliştirici tarafından ücretsiz olarak kullanılabiliyor. OpenAI, o1’e erişmek için gereken Pro aboneliği için aylık 200 dolar ücret alıyor. DeepSeek’in modelleri ise web’de, şirketin API’si aracılığıyla ve mobil uygulamalar aracılığıyla kullanılabilir durumda.

Kullanmak için DeepSeek web sitesinde ücretsiz şekilde bir hesap açmanız yeterli. Hepsi bu kadar. Şirket “DeepSeek’in hizmetlerine yönelik büyük ölçekli kötü niyetli saldırılara” önlem olarak yeni kayıtları geçici olarak durdurdu. Bu geçici olaydan birazdan bahsedeceğiz. Bir süreliğine yeni üyelikler durduruldu ve her şey normale dönecek. Mevcut kullanıcılar oturum açabiliyor ve platformu normal şekilde kullanabiliyor.

Sonuç olarak, platformu kullanmak ücretsiz.

DeepSeek’in Maliyeti

Yapay zeka alanındaki çalışmalarına devam eden şirket, Aralık 2024’te V3 sürümünü piyasaya sürdü. V3‘ün 671 milyar parametreli bir model olduğu ve eğitilmesinin 2 aydan kısa sürdüğü bildirildi. Dahası, Jeffries’in yakın zamanda yaptığı bir analize göre DeepSeek’in “eğitim maliyeti yalnızca 5,6 milyon dolar (2 dolar/800 saat kiralama maliyeti varsayıldığında).

Bu ne anlama geliyor? Meta’nın geliştirdiği Llama modeline harcadığı paranın %10’undan daha az miktarda kaynak tüketildi. Google, Microsoft, xAI ve OpenAI gibi diğer ABD merkezli şirketler ise AI modellerini eğitmek için yüz milyonlarca ve hatta milyarlarca dolar harcadı, harcıyor. Yani Çinli girişimin harcadığı miktar rakiplerinin yanında devede kulak kalır.

DeepSeek Performansı

Benchmark testlerine bakılırsa, DeepSeek V3’ün performansı GPT-4o ve Claude 3.5 Sonnet ile aynı seviyede. Aralık 2024’te The Hill‘de yayınlanan bir köşe yazısında, DeepSeek’in başarısı Amerika’nın “Sputnik Anı” olarak nitelendirildi.

V3 bir kenara, DeepSeek takvim yaprakları Kasım 2024’ü gösterdiğinde R1-Lite-Preview isimli bir önizleme sürümü piyasaya sürdü. En önemlisi ise OpenAI’ın o1 akıl yürütme modelleri ailesinden daha iyi performans gösterebileceği ve bunu çok daha düşük bir maliyetle yapabileceği iddia edildi.

Şirket, R1 modelinin göreve bağlı olarak OpenAI’nin o1’ine göre 20 ile 50 kat daha ucuz olduğunu tahmin ediyor. DeepSeek daha sonra Ocak 2025’te DeepSeek-R1 ve DeepSeek-R1-Zero’yu piyasaya sürdü.

Açık Kaynak Kodlu

R1 modeli, o1 rakibinden farklı olarak açık kaynak kodlu. Yani dünya üzerindeki herhangi bir geliştirici bu modeli alıp inceleyebiliyor, kullanabiliyor ve üzerinde değişiklikler yapabiliyor. Bu çok önemli bir detay. R1 modelinden dünya üzerindeki birçok ülke ve geliştirici de faydalanabilir. Bu nedenle V3 ve R1, ismi duyulmaya başladığı günden bu yana büyük bir patlama yaşadı.

R1 Modeli Nedir?

İnsanların hakkında konuştuğu bu R1 modeli nedir? R1, Aralık ayında ChatGPT kullanıcılarına sunulan OpenAI’nin o1 modeliyle eşit bir performansa sahip olduğu iddia edilen ve insanları en çok heyecanlandıran DeepSeek AI modeli. DeepSeek, bildiğiniz gibi Pazartesi günü tüm dünyada Apple’ın uygulama mağazasından indirilen en popüler ücretsiz uygulama oldu.

Bu model, daha az bellek kullanımı gerektiren farklı bir tür iç mimari kullanıyor ve böylece her aramanın veya sohbet robotu tarzı sistemle etkileşimin hesaplama maliyetlerini önemli ölçüde azaltıyor. Özellikle matematik ve kodlama gibi karmaşık akıl yürütme görevlerinin üstesinden gelme becerisi nedeniyle araştırmacılar tarafından övgüyle karşılanan DeepSeek, hesaplama gücünün çok az bir kısmıyla rakipleriyle karşılaştırılabilir sonuçlar üretebiliyor.

Yapay zeka girişimi, modeli geliştirmenin iki ay ve 6 milyon dolardan az sürdüğünü söylüyor. Bazı kişiler ise bunun fazlaca iddialı olduğunu, miktarın çok düşük olduğunu belirtiyor. Her ne olursa olsun, ABD’li teknoloji şirketlerinin yapay zekayı geliştirmek için harcadıkları milyarlarca dolardan çok daha az ve işletmesi daha ucuz.

ChatGPT’nin Önüne Geçti

DeepSeek’in V3 destekli AI Asistanı, AppStore ve Play Store gibi uygulama mağazalarında basamakları çok hızlı şekilde tırmanarak listelerin en üstüne çıktı. Daha önce ChatGPT vardı, artık en üst sıralarda DeepSeek yer alıyor.

Risk sermayedarı Marc Andreesen, kısa bir süre önce sosyal medyada yaptığı bir paylaşımda DeepSeek’in sohbet robotunu “şimdiye kadar gördüğüm en şaşırtıcı ve etkileyici buluşlardan biri” ve “dünyaya derin bir armağan” olarak nitelendirdi.

DeepSeek Nasıl Aniden Önemli Hale Geldi?

Pekala neden birdenbire bu kadar çok konuşmaya başladı, bir patlama yaşandı? ChatGPT’nin Kasım 2023’te piyasaya sürülmesinden bu yana, Amerikan AI şirketleri daha büyük, daha güçlü, daha geniş, daha fazla güç ve kaynak yoğun büyük dil modelleri oluşturmaya odaklandı. OpenAI, Microsoft, Anthropic ve Google gibi şirketler, daha uygun maliyetli ve enerji tasarruflu dil modelleri inşa etmeye çalışmak yerine milyarlarca dolar kaynak ayırarak teknolojilerinin ilerlemesini istediler.

Bir örnek olarak, xAI CEO’su Elon Musk’ın sadece 2024 yılında yapay zeka girişimleri için kişisel olarak 10 milyar dolardan para harcadığı tahmin ediliyor. OpenAI ve ortakları, ABD genelinde yeşil enerji tesislerinin ve AI veri merkezlerinin inşasını büyük ölçüde hızlandıracak 500 milyar dolarlık Project Stargate girişimini duyurdu. CEO Sundar Pichai’ye göre Google, Gemini platformunu 2025 yılı boyunca ölçeklendirmeye öncelik vermeyi planlıyor ve bu hedef doğrultusunda bu yıl milyarlarca dolar harcaması bekleniyor. Meta, Ocak ayı ortasında yaptığı açıklamayla bu yıl yapay zeka gelişimi için 65 milyar dolar kadar harcama yapacağını duyurdu.

DeepSeek tüm dünyaya aslında bunların hiçbirine gerek olmadığını gösterdi. Çok daha düşük maliyetlerle aslında aynı şeyleri yapmak mümkündü. Son aylarda Amerikan ekonomisini canlandırmaya yardımcı olan ve ve NVIDIA gibi şirketlerini daha zengin hale getiren “yapay zeka patlaması” bir aldatmacadan mı ibaretti?

Bunun yanında ABD, geçtiğimiz yıl Çin’e olan öncü GPU sevkiyatlarını yasaklamıştı. Böylelikle tek hakim güç olmak, bazı şeyleri kontrol etmek istiyorlardı. DeepSeek en azından şimdilik planları alt üst etmiş gibi görünüyor, ABD’nin yapay zekada gerçekten lider olup olmadığı sorgulanıyor.

Aralık ayı sonunda ücretsiz ve açık kaynaklı dil modelini tanıtan DeepSeek, bunun sadece iki ay içinde, 6 milyon doların altında bir maliyetle geliştirildiğini iddia etmişti. Platformu kullanan kullanıcılar da genel olarak sonuçlardan memnun kaldı.

6 milyon dolar, söylediğimiz gibi aynı işi ortaya koymak için milyarlarca dolar harcayan Batılı şirketler için bir çerez parası. Şirket geçtiğimiz hafta, birçok üçüncü taraf testinde OpenAI’ın son modelinden daha iyi performans gösterdiği bildirilen bir muhakeme modeli yayınladı.

Neden Daha Önce Bilinmiyordu?

Şirket, Meta (Llama) ve OpenAI (ChatGPT) tarafından üretilen modellere nazaran çok daha düşük maliyetle teknik yenilikler sunmak üzere sessiz sedasız ilerliyordu. DeepSeek, atılımlarının potansiyeli söz konusu olduğunda Silikon Vadisi şirketleri gibi ön plana çıkmıyordu.

Dünyayı Nasıl Etkiledi?

ABD Başkanı Donald Trump, kısa süre önce yapay zeka altyapısına yönelik tarihin en büyük yatırımlarından biri olarak tanımlanan “Stargate” projesini duyurmuştu. OpenAI, Oracle ve SoftBank liderliğinde başlatılan bu projeye 500 milyar dolarlık devasa bir bütçe ayrıldı.

Özetleyecek olursak, ABD bu büyük yatırımla birlikte teknoloji sahasında tartışmasız lider olmayı umuyordu. Yatırımların merkezinde ise “yapay zeka” vardı. Ancak DeepSeek öyle bir anda piyasaya giriş yaptı ki, her şeyi darmaduman etti. ABD Başkanı Donald Trump, bunun “kazanmak için rekabet etmeye” odaklanması gereken ABD şirketleri için bir “uyandırma çağrısı” olduğunu söyledi.

ABD, Pekin’in teknoloji konusunda üstünlük sağlama çabalarını kontrol altına almaya çalışıyordu. Zaman içinde birçok ambargo, birçok kısıtlama haberi gördük. En önemli kısıtlama ise Çin’e gelişmiş çip ihracatının yasaklanmasıydı. Ancak Çin, kısıtlamalara rağmen düşük bütçeyle daha iyisini yapmayı başarmış görünüyor.

Pekin, Devlet Başkanı Xi Jinping’in yapay zekayı en önemli öncelik olarak ilan etmesiyle teknoloji dünyasına yönelik büyük çabalarını ikiye katladı. DeepSeek ise Çin’in hedefleri ve ABD’ye bir yanıt açısından kritik öneme sahip.

Truist analistlerinden Keith Lerner CNN‘e verdiği demeçte şu kelimeleri sarf etti:

“Sonuç olarak, ABD’nin üstün performansı teknoloji ve ABD şirketlerinin yapay zeka alanında sahip olduğu liderlikten kaynaklanıyor. DeepSeek modelinin piyasaya sürülmesi, yatırımcıların ABD şirketlerinin sahip olduğu liderliği, ne kadar harcama yapıldığını ve bu harcamaların kâra (ya da aşırı harcamaya) yol açıp açmayacağını sorgulamasına neden oluyor.”

Raymond James’in yarı iletken analisti Srini Pajjuri, Pazartesi günkü bir notunda “DeepSeek’in ABD’li hiper ölçekleyiciler kadar bilgi işleme erişimi olmadığı açık ve bir şekilde oldukça rekabetçi görünen bir model geliştirmeyi başardı” dedi.

Pajjuri, DeepSeek’in Amazon ve Microsoft gibi büyük bilgi işlem oyuncularından oluşan bir grup olan “ABD’li hiper ölçekleyiciler arasında daha da aciliyet yaratabileceğini” söyledi. Analist, özellikle bu şirketlerin grafik işlem birimlerine erişim avantajlarından yararlanarak kendilerini daha ucuz seçeneklerden ayırabileceklerini söyledi.

Bildiğiniz üzere GPU’lar, büyük yapay zeka modellerini eğitmek için gereken altyapının en önemli parçası. Değerine değer katan NVIDIA ise grafik yongaları konusunda pazar lideri. Hatta basamakları hızla tırmanarak bir dönem “dünyanın en değerli şirketi” ünvanını ele geçirmişti.

Citi analistlerine göre, DeepSeek haberlerinin ardından bilgi işlem maliyeti önemli bir tartışma konusu haline geldi. ABD’li şirketlerin en gelişmiş yapay zeka modellerindeki hakimiyeti tehdit altında. Rakipler ise halihazırdaki en güçlü çiplere erişemiyor, kısıtlamalara rağmen iyi işler ortaya çıkarmaya çalışıyor.

Bernstein analistleri ise DeepSeek aracının gerçekten 6 milyon dolardan daha az bir fiyata inşa edilip edilmediği konusunda şüphelerini dile getirdiler. Bu rakamın, teknolojiyi bugün bulunduğu noktaya getirmek için önceki araştırma ve deneylerden kaynaklanan diğer maliyetleri dışarıda bırakıp bırakmadığını sorguladılar.

OpenAI Şaşkın

OpenAI CEO’su Sam Altman, Deepseek’in yaptığı hızlı çıkışı “etkileyici” olarak nitelendirerek, “Açıkçası çok daha iyi modeller sunacağız ve ayrıca yeni bir rakibe sahip olmak yasaldır! dedi. Sam Altman, bu rekabete daha iyi yapay zeka modelleriyle yanıt vereceklerini söylüyor.

Peki maliyet konusu? CEO, X üzerinden yaptığı paylaşımda ise “Fiyat konusunda sunulanlara bakılırsa etkileyici bir model” diyerek düşük bütçeli yapay zeka çözümünü değerlendirdi.

NVIDIA da Övdü

Bir NVIDIA sözcüsü, DeepSeek hakkındaki görüşlerini aktardı:

“DeepSeek mükemmel bir yapay zeka ilerlemesi ve Test Süresi Ölçeklendirmesinin (Test Time Scaling) mükemmel bir örneği. DeepSeek’in çalışması, bu tekniği kullanarak yeni modellerin nasıl oluşturulabileceğini, yaygın olarak kullanılabilen modellerden ve tamamen ihracat kontrolü uyumlu bilgi işlemden nasıl yararlanılabileceğini gösteriyor. Çıkarım, önemli sayıda NVIDIA GPU ve yüksek performanslı ağ gerektirmekte. Artık üç ölçeklendirme yasamız var: devam eden eğitim öncesi, eğitim sonrası ve yeni test zamanı ölçeklendirmesi.”

NVIDIA, yapay zeka çıkarımının ya da karar vermek veya tahminlerde bulunmak için yapay zeka modellerinin kullanılmasının “önemli sayıda NVIDIA GPU ve yüksek performanslı ağ gerektirdiğini özellikle vurguladı.

Finansal Piyasalarda Deprem

Bu gelişmeler, büyük teknoloji şirketlerinin yapay zeka modellerine ve veri merkezlerine yaptıkları yatırım miktarıyla ilgili endişeleri artırdı ve ABD’nin sektöre daha önce inanıldığı kadar liderlik etmediği konusunda alarm verdi.

DeepSeek’in hünerlerini sergilemesiyle küresel finansal piyasalar tam anlamıyla sarsıldı. ABD’den Avrupa’ya kadar birçok teknoloji şirketi ciddi oranlarda değer kaybetti.

NASDAQ endeksi 600 puanın üzerinde değer kaybederken, çip üreticisi NVIDIA’nın hisselerinde %17, Broadcom’da %17’nin üzerinde düşüş kaydedildi. Microsoft, Google’ın ana şirketi Alphabet, Amazon ve Meta gibi teknoloji devlerinin hisselerinde de %2 ile 3 arasında değer kaybı yaşandı. NVIDIA, sadece bir günde yaklaşık 600 milyar dolar kaybetti. Broadcom’un piyasa değeri gün içinde 200 milyar dolar eridi. AMD’nin (Advanced Micro Devices) kayıpları ise %6’nın üzerine çıktı.

ABD’li enerji şirketi Constellation’da kayıplar %20’yi aşarken, Vistra %30’a varan daha derin değer kayıpları yaşadı.

Öte taraftan bu süreçten Asyalı teknoloji şirketleri de etkilendi. Hepinizin yakından tanıdığı Tayvanlı yarı iletken devi TSMC’nin hisselerinde %9’un üzerinde düşüş yaşandı. Yine önemli bir şirket olarak İngiltere merkezli Arm Holdings’in hisseleri %10’un üzerinde geriledi. Micron ise %11 değer kaybına uğradı. Bu düşüşler DeepSeek’in yarattığı etkinin küresel ölçekte olduğunu kanıtlıyor.

Büyük teknoloji şirketleri yapay zeka yatırımlarını artırma kararı aldı. Meta, bu yıl yapay zeka harcamalarını 60-65 milyar dolar seviyesine çıkaracağını açıkladı. Ayrıca 500 milyar dolar bütçeli “Project Stargate” veri merkezi programı kapsamında SoftBank ile iş birliği yapılacağı duyuruldu.

Siber Saldırılar

DeepSeek, internet sitesine yönelik yoğun siber saldırılar nedeniyle yeni kullanıcı kayıtlarını geçici olarak durdurduğunu açıkladı. Ancak mobil uygulama hem Çin’de hem de diğer ülkelerde aktif olarak hizmet vermeye devam ediyor. Mevcut kullanıcılar da platformu kullanmaya devam edebiliyor.

Etiketler: abd açık kaynak ai chatgpt çin google maliyet meta openai performans r1 v3 yapay zeka

Teknoloji Dünyasını Sarsan Yapay Zeka: DeepSeek Nedir?

Fatih Işık

Yorum Yap Yanıtı iptal et

Technopat Sosyal

Technopat Video

Kategoriler

Sosyal Medya