Anasayfa Makale Google’ın ChatGPT Rakibi Yapay Zekası: Gemini Nedir?

Google’ın ChatGPT Rakibi Yapay Zekası: Gemini Nedir?

Yazar

-

14 Aralık 2023

Yapay zeka, hızlı bir şekilde her türden yazılıma, donanımlara ve işletim sistemlerine dahil olmaya başladı. Artık rahatça söyleyebiliriz ki teknolojinin geleceği yapay zekada. Teknoloji devleri de elindeki tüm imkanlarını kullanarak yapay zeka teknolojilerini geliştirmek için büyük çaba harcıyor. Bugün ise Google’ın son hamlesi olan Gemini’ye daha yakından bakacağız.

Microsoft ve ortağı OpenAI zaten herkes tarafından biliniyor. Microsoft, yapay zeka becerilerini birer birer Windows işletim sistemine getirmeye başladı. Duyumlarımıza göre yapay zeka henüz resmi olarak tanıtılmayan Windows 12‘nin her noktasına kendine yer bulacak. Öte yandan, Elon Musk’ın xAI projesinden ve Grok isimli sohbet botundan söz etmiştik. Musk, xAI yapay zeka algoritmalarının şu anda var olanların arasında en iyisi olduğunu iddia etti.

Bunların yanı sıra Meta’nın da AI alanında çalışmalar yaptığını biliyoruz. Şirket bir süre önce yapay zeka kod yazma aracı Code LIama’yı duyurmuştu. Ayrıca Meta ve IBM tarafından AI Alliance adında uluslararası bir topluluk kuruldu.

En İyi Yapay Zeka Sohbet Botları: ChatGPT, Bard, Bing ve Daha Fazlası

Uzun lafın kısası, teknoloji devleri yapay zeka sektöründe de çarpışmaya başladı. Google ise rakiplerinden geri kalmamak amacıyla yeni bir yapay zeka platformu duyurdu. Yeni üretken yapay zeka modeli Gemini’nin ChatGPT için ciddi bir tehdit olduğu söyleniyor. Arama devi, Gemini’yi şimdiye kadar geliştirdiği en yetenekli ve genel amaçlı yapay zeka olarak nitelendiriyor.

Gemini LLM (büyük dil modeli-large language model) çok modlu; yani metin, ses, görüntü ve video dahil olmak üzere farklı bilgi türleriyle çalışabiliyor. Yeni üretken yapay zeka kısıtlı olarak kullanıma sunuldu, ancak şirket gelişmiş versiyonunun 2024 yılında geleceği söylendi.

Gemini AI Nedir?

Özetle Gemini, sadece metinleri değil, görüntüleri, videoları ve sesleri de anlayabilen yeni ve güçlü bir yapay zeka modeli. Çok modlu bir model olan Gemini’nin matematik, fizik ve diğer alanlardaki karmaşık görevleri tamamlayabildiği ve çeşitli programlama dillerinde yüksek kaliteli kodları anlayıp üretebildiği belirtiliyor.

Gemini, Google’ın Tensör İşleme Birimleri (Tensor Processing Units-TPU) üzerinde eğitildi. Google’ın önceki PaLM çözümünden daha hızlı ve daha maliyetsiz olması nedeniyle çok daha verimli. Google ayrıca, büyük ölçekli modelleri eğitmesi ve çalıştırması için özel olarak tasarlanmış TPU sisteminin daha yeni bir sürümü olan TPU v5p’yi de piyasaya sürecek.

Şu anda Google Bard ve Google Pixel 8 ile entegrasyon yoluyla kullanılabiliyor ve kademeli olarak diğer Google hizmetlerine de eklenecek. Google DeepMind CEO’su ve kurucu ortağı Dennis Hassabis, yeni çözümün Google Research’teki çalışanlar da dahil olmak üzere Google’daki ekiplerin büyük ölçekli işbirliği sayesinde ortaya çıktığını söyledi.

“Sıfırdan çok modlu olacak şekilde inşa edildi, yani metin, kod, ses, görüntü ve video dahil olmak üzere farklı bilgi türlerini genelleştirebiliyor ve sorunsuz bir şekilde anlayabiliyor. Ayrıca bunlar arasında çalışma yapabiliyor ve tüm her şeyi birleştirebiliyor.”

Eğer Google hedefine ulaşır ve kullanıcıların beğenisini kazanırsa OpenAI’ın ChatGPT’sine büyük bir rakip doğmuş olacak. Gemini AI, Google’ın artık birleşmiş olan yapay zeka bölümleri DeepMind ve Google Brain’den gelen araştırmacılarla birlikte geliştirilen bir yapay zeka modeli. Yeni model, doğal dil işlemede önemli bir ilerleme olarak lanse edildi ve Google bunu “şirketin şimdiye kadarki en büyük bilim ve mühendislik projesi” olarak adlandırıyor.

Kullanıcılar Gemini’ye hemen erişim sağlayabilirken, daha gelişmiş sürümün önümüzdeki yılın başlarında gelmesi planlanıyor. Uzun zamandır beklenen AI modeli teknoloji dünyası tarafından yakından izleniyor. Pek çok kişi ise Gemini ve OpenAI’ın büyük dil modeli GPT-4’ün rekabetini merak ediyor.

The Information’ın daha önce bildirdiğine göre teknoloji devi, OpenAI tarafından desteklenen Microsoft Copilot’a karşı koymak için teknolojinin kod üretme yeteneklerini de geliştirdi. Google’ın Eylül ayında küçük bir grup şirkete modelin erken bir versiyonunu dağıtmaya başladığı söyleniyordu. Teknolojiyi daha önce test etmiş olan bir kişi, Google’ın tüketici ürünlerinden elde ettiği verilerin yanı sıra internetten toplanan bilgileri de kullanacağını belirtti. Bu nedenle Gemini bazı açılardan GPT-4‘e kıyasla daha avantajı olabilir, ekstra özellikler sayesinde yapay zeka modeli kullanıcının sorduğu soruları ve niyetini daha doğru bir şekilde anlayabilir.

Söz konusu kişi ayrıca modelin doğru cevaplar konusunda başarılı olduğunu söyledi. Yapay zekada halüsinasyon olarak bilinen yaygın bir sorun da yanlış cevaplandırma. Raporlara bakılırsa Gemini bu konuda başarılı ve daha az sayıda yanlış cevap üretiyor. SemiAnalysis blogunun arkasındaki araştırmacılar da Gemini’nin Google’ın üstün çiplere erişimi nedeniyle GPT-4’ten daha iyi performans göstereceğini tahmin ettiler.

Multimodel Ne Anlama Geliyor?

Google Gemini multimodel, yani çok modlu bir yapay zeka. Başka bir deyişle, birden fazla veri türünü işleyebiliyor. Gemini’nin görüntü, metin, ses, video ve kodlama konusunda maharetli olmasını bekliyoruz. Yeni yetenekler, görsel grafiklerin yazılı analizi gibi özelliklere olanak tanıyor.

Gemini Sürümleri Arasındaki Fark Ne?

Google, Gemini’yi Google’ın veri merkezlerinden mobil cihazlara kadar her yerde çalışabilen esnek bir model olarak tanımlıyor. Bu ölçeklenebilirliği sağlamak için Gemini üç boyutta piyasaya sürülüyor: Gemini Nano, Gemini Pro ve Gemini Ultra.

Gemini Nano: Gemini Nano, özellikle Google Pixel 8 olmak üzere akıllı telefonlarda çalışmak üzere tasarlandı. Sohbet uygulamalarında yanıt önerme veya metin özetleme gibi harici sunuculara bağlanmadan verimli yapay zeka işleme gerektiren cihaz içi görevleri gerçekleştirmek için kullanılacak.
Gemini Pro: Google’ın veri merkezlerinde çalışan Gemini Pro, şirketin yapay zeka sohbet robotu Bard’ın en son sürümüne güç sağlamak için tasarlandı. Hızlı yanıt süreleri sunma ve karmaşık sorguları anlama yeteneğine sahip.
Gemini Ultra: Henüz yaygın kullanıma sunulmamış olsa da Google, Gemini Ultra’yı “büyük dil modeli (LLM) araştırma ve geliştirmesinde yaygın olarak kullanılan 32 akademik ölçütten 30’unda mevcut son teknoloji sonuçlarını” aşan en yetenekli modeli olarak tanımlıyor. Oldukça karmaşık görevler için tasarlandı ve mevcut test aşamasını tamamladıktan sonra piyasaya sürülmesi bekleniyor.

Özetle Nano hızlı cihaz içi görevler için tasarlanırken, Pro orta kademe olarak hizmet veren çok yönlü bir sürüm. Ultra, üç versiyonun en güçlüsü ve güvenlik kontrollerinden geçtiği için önümüzdeki yıl kullanıma sunulacak.

Gemini AI Nasıl Kullanılır? Bard ile Bağlantılı mı?

Söylediğimiz gibi, Gemini şu anda Pixel 8 telefonlar ve Bard sohbet robotu gibi Nano/Pro sürümlerindeki Google ürünlerinde mevcut. Google, Gemini’yi zaman içinde Arama, Reklamlar, Chrome ve diğer hizmetlerine entegre etmeyi planlıyor.

Bard bildiğiniz gibi daha öncesinde kullanıma sunulan bir platformdu. Gemini-Bard entegrasyonu sayesinde kullanıcıların soruları ve amacı daha iyi analiz edilecek ve yüksek kaliteli yanıtlar üretilebilecek. Gemini’nin çok modlu olması nedeniyle Bard’ın görüntü, ses ve video gibi her türlü medyayı sorunsuz bir şekilde işlemesine olanak tanınarak kullanıcı deneyimi geliştiriliyor.

Google Bard’ı kullanmak için bu bağlantıya tıklayın.
Sonrasında kişisel Google hesabınızla giriş yapın ve Bard’a bir şeyler sormaya başlayabilirsiniz.

Bard daha öncesinde ChatGPT kadar becerikli değildi. Ancak bu durum daha gelişmiş muhakeme ve anlama kapasitesi sunan Gemini’nin piyasaya sürülmesiyle değişti. Yakın zamanda yayınlanan bir teknik rapor Gemini’nin en yetenekli versiyonunun çoktan seçmeli sınavlarda, ilkokul matematiğinde ve diğer ölçütlerde GPT-4’ten daha iyi performans gösterdiğini ortaya koydu.

Şu anda Bard, Gemini’nin yeteneklerinin yalnızca küçük bir kısmını kullanıyor. Görüntü, ses ve video kabul eden ve oluşturan çok modlu işlev, önümüzdeki yıl Bard’ın Bard Advanced adlı daha yeni sürümüyle piyasaya sürülecek. Gemini’nin en güçlü ve yetenekli varyantı olan Gemini Ultra’yı kullanacak. Çok modlu chatbot deneyiminin yanı sıra Gemini Ultra, şu anda Gemini Pro için mevcut olan tek dil olan İngilizce’den daha fazla dili de destekleyecek.

Geliştiriciler ve kurumsal müşteriler 13 Aralık’tan itibaren Google’ın AI Studio ve Google Cloud Vertex AI’daki Gemini API aracılığıyla Gemini Pro’ya erişebilecekler. Android geliştiricileri Gemini Nano’ya AICore üzerinden erişebilecek ve bu da erken önizleme temelinde sunulacak.

Bard ve Gemini Kısıtlamaları

İlk olarak, yalnızca İngilizce etkileşimler küresel ölçekte erişilebilirliği engellemekte.
Gemini Pro’nun Bard’a entegrasyonu şu an için sınırlı.
Entegrasyon henüz Avrupa Birliği’nde ve farklı bölgelerde yapılmadı. Bu nedenle coğrafi kısıtlamalar da var.
Gemini Pro’nun sadece metin tabanlı versiyonuna Bard’dan erişilebiliyor.
Gemini henüz ilk aşamalarında olduğundan, çok modlu etkileşimleri kullanmak isteyenler biraz daha beklemek zorunda kalabilir. Google, yetenekleri ve erişilebilirliği geliştirmek ve genişletmek için çalışıyor.

Gemini Neden GPT-4 Gibi Diğer Modellerden Farklı?

Google’ın yeni Gemini modeli bugüne kadarki en büyük, en gelişmiş yapay zeka modellerinden biri gibi görünüyor. Ancak Ultra modelinin piyasaya sürülmesiyle bu tasdiklenmiş olacak. Şu anda AI sohbet robotlarına güç veren diğer popüler modellerle karşılaştırıldığında, Gemini doğal çok modlu özelliği nedeniyle öne çıkarıyor. GPT-4 gibi diğer modeller çok modlu destek için eklentilere ve entegrasyonlara ihtiyaç duyuyor.

Bunun yanında Gemini, MMLU (Massive Multitask Language Understanding) konusunda insan uzmanlardan daha iyi performans gösteren ilk model. Eğer her şey söylendiği gibiyse, Gemini bilgi ve problem çözme yetenekleri bakımından çok başarılı olacak.

Gemini GPT’den İyi mi?

Bu konuda Google’ın sağladığı resmi verilerden başka verimiz yok. Yazılım devi, Gemini ve GPT-4’ün performansını kıyaslayabileceğimiz bir tablo yayınladı. Google’a göre GPT-4, Gemini’den yalnızca “HellaSwag muhakemesi” adı verilen bir alanda daha iyi performans gösteriyor. Bu, günlük görevler için kullanılan sağduyulu muhakeme. GPT-4, önde olduğu muhakeme yeteneği söz konusu olduğunda %95.3’lük skorla (Gemini %87.8) daha iyi görünüyor. Diğer tüm alanlarda ise Gemini Ultra birinci oldu:

Yetenek	Kıyaslama	Gemini Ultra	GPT-4
Genel	MMLU (57 konuda çeşitli soruların temsili)	%90.0	%86.4
Akıl-Mantık Yürütme	Big-Bench Hard (Çok adımlı muhakeme gerektiren zorlu görevler) DROP (Okuduğunu anlama)	%83.6 %82.4	%83.1 %80.9
Matematik	GSM8K (Temel aritmetik manipülasyon) MATH (Zorlu matematik problemleri)	%94.4 %53.2	%92.0 %52.9
Kodlama	HumanEval (Python kod üretimi) Natural2Code (Python kod üretimi)	%74.4 %74.9	%67.0 %73.9