BİLİM VE TEKNOLOJİ

Google Deepmind’ın yeni Gemini modeli muhteşem görünüyor ancak AI heyecanının zirveye ulaştığına işaret edebilir


Google ve ana şirketi Alphabet’in CEO’su Sundar Pichai, MIT Technology Review’a “Model doğası gereği daha yetenekli” dedi. “Bu bir platform. Yapay zeka, web veya mobilden daha büyük, derin bir platform değişimidir. Dolayısıyla bu bizim için büyük bir adımı temsil ediyor.”

Bu Google için büyük bir adım, ancak bir bütün olarak alanın ileriye doğru dev bir adım olduğu söylenemez. Google DeepMind, Gemini’nin 32 standart performans ölçümünden 30’unda GPT-4’ü geride bıraktığını iddia ediyor. Ancak yine de aralarındaki sınırlar incedir. DeepMind’ın yaptığı şey, yapay zekanın mevcut en iyi yeteneklerini tek bir güçlü pakette toplamaktır. Demolara bakılırsa pek çok şeyi çok iyi yapıyor ancak daha önce görmediğimiz çok az şey var. Bir sonraki büyük olayla ilgili tüm heyecana rağmen Gemini, yapay zeka heyecanının zirvesine ulaştığımızın bir işareti olabilir. En azından şimdilik.

Washington Üniversitesi’nde çevrimiçi arama konusunda uzmanlaşmış bir profesör olan Chirag Shah, lansmanı Apple’ın her yıl yeni bir iPhone’u piyasaya sürmesiyle karşılaştırıyor. “Belki de artık farklı bir eşiğe ulaştık, o kadar çok şey gördük ki bu bizi pek etkilemiyor” diyor.

GPT-4 gibi Gemini de çok modludur, yani metin, resim, ses gibi birden fazla türde girişi yönetecek şekilde eğitilmiştir. Ev işlerinden üniversite matematiğine ve ekonomiye kadar her konudaki soruları yanıtlamak için bu farklı formatları birleştirebilir.

Dün gazetecilere yönelik bir demoda Google, Gemini’nin bir grafiğin mevcut ekran görüntüsünü alma, yüzlerce sayfalık araştırmayı yeni verilerle analiz etme ve ardından grafiği bu yeni bilgilerle güncelleme yeteneğini gösterdi. Başka bir örnekte Gemini’ye tavada pişen omletin resimleri gösteriliyor ve omletin henüz pişip pişmediği soruluyor (metin değil, konuşma kullanarak). “Yumurtalar hâlâ akıcı olduğundan hazır değil” diye yanıtlıyor.

Ancak çoğu insanın tam deneyim için beklemesi gerekecek. Bugün piyasaya sürülen sürüm, Google’ın metin tabanlı arama sohbet robotu Bard’ın arka ucu olup şirket, bunun ona daha gelişmiş akıl yürütme, planlama ve anlama yetenekleri kazandıracağını söylüyor. Gemini’nin tam sürümü önümüzdeki aylarda kademeli olarak yayınlanacak. Yeni Gemini destekli Bard, başlangıçta AB ve Birleşik Krallık hariç 170’den fazla ülkede İngilizce olarak satışa sunulacak. Google’ın Bard’dan sorumlu başkan yardımcısı Sissie Hsiao, bunun şirketin yerel düzenleyicilerle “ilişki kurmasına” olanak sağlamak olduğunu söylüyor.

Gemini’nin ayrıca üç boyutu vardır: Ultra, Pro ve Nano. Ultra tam güçlü versiyondur; Pro ve Nano, daha sınırlı bilgi işlem kaynaklarıyla çalışan uygulamalara özel olarak tasarlanmıştır. Nano, Google’ın yeni Pixel telefonları gibi cihazlarda çalışacak şekilde tasarlanmıştır. Geliştiriciler ve işletmeler Gemini Pro’ya 13 Aralık’tan itibaren erişebilecekler. Google yöneticileri bir basın toplantısında gazetecilere verdiği demeçte, en güçlü model olan Gemini Ultra’nın “kapsamlı güven ve emniyet kontrollerinin ardından” “gelecek yılın başlarında” satışa sunulacağını söyledi.

Pichai bize “Bunu modellerin İkizler dönemi olarak düşünüyorum” dedi. “Google DeepMind bu şekilde yapay zeka üzerinde gelişecek ve ilerleme kaydedecek. Dolayısıyla bu her zaman yapay zeka teknolojisinde ilerleme kaydettiğimiz noktanın sınırını temsil edecek.”



Source link