Google’ın Gemini AI demosunun “kurgulanmış” olduğu ortaya çıktı

Google, kısa bir süre önce ChatGPT ve arkasındaki GPT modellerine bir cevap olarak Gemini yapay zeka modelini tanıttı. Gemini’nin GPT-4’ü neredeyse her alanda geçtiğini söyleyen Google, ayrıca çeşitli demo videoları da paylaştı. Paylaşılan altı dakikalık bir video Gemini’nin multimodal yeteneklerini (örneğin görüntü tanıma ile birleştirilmiş sözlü konuşma istemleri) gösteriyordu. Ancak bu videonun aslında tam olarak gerçek olmadığı ortaya çıktı.

Google, Gemini videosunda insanları aldattı mı?

6 dakikalık demo videosunda Gemini görüntüleri tanıyor, saniyeler içinde yanıt veriyor, fincan numarasında bardağın altına gizlenen kağıdı doğru şekilde takip edebiliyor ve daha fazlasını yapabiliyordu. Ancak bu video biraz gerçek olmayacak kadar iyiydi. Nitekim Google’da bunu kabul ediyor. Bu video tüm dünyaya hızlı bir şekilde yayılırken altındaki açıklama kısmı gözlerden kaçmış gibi: “Bu demonun amaçları doğrultusunda, gecikme süresi azaltılmış ve Gemini çıktıları kısa olması için kısaltılmıştır.Bu açıklama diğer videolarda bulunmuyor.

Öte yandan bu durum infial yaratılacak bir şey değil. Çünkü şirketler demo videolarında bu tip şeyleri sık sık yapıyorlar. Google DeepMind’da araştırma başkan yardımcısı ve derin öğrenme lideri Oriol Vinyals, X’te yaptığı açıklamada “Videodaki tüm kullanıcı komutları ve çıktıları gerçektir ve kısa olması için kısaltılmıştır” diyor. Yani Google’a göre videoda gösterilen yetenekler gerçek, sadece bu kadar tepkisel değil. Öte yandan Vinyals, Gemini ile oluşturulan çok modlu kullanıcı deneyimlerinin neye benzeyebileceğini göstermek ve geliştiricilere ilham vermek için böyle bir video hazırladıklarını aktarıyor.

Ek olarak Gemini’ye görüntüler ve metinler verildiği ve bir sonraki adımda ne olacağını tahmin ederek yanıt vermesinin istediği de belirtildi. Google ayrıca “Gemini’nin yeteneklerini çok çeşitli zorluklarda test etmek için görüntüler çekerek demoyu oluşturduk. Daha sonra Gemini’yi görüntülerden kareler kullanarak ve metin yoluyla yönlendirdik.” açıklamasını yapıyor. Yani Gemini, Google’ın videoda gösterdiği şeyleri yapıyor (anlık tepkisellikle)  gibi görünse de, bunları canlı olarak ve ima ettikleri şekilde yapmadı ve belki de yapamadı. 

Google, Gemini’yi en gelişmiş yapay zeka modeli olarak niteliyor ve belki de gerçekten de öyledir. Şimdilik bunu bilemiyoruz, ancak en önemli şey bu modelin temel olarak “multimodal” olması. Yani fotoğraf, video, ses ve yazı gibi girdileri işleyebiliyor. ChatGPT ve diğerleri bunu eklentiler ile yapıyor, temel olarak gerçek çok modelli değiller. Bunların yanı sıra Gemini’nin gerçek potansiyelini anlamak için Google’ın küçük bir beta sürüm başlatması daha doğru olabilir. Bu sayede insanlar gerçek dünya koşullarında modeli zorlayabilir ve ne kadar güçlü olduğunu deneyimleyebilir.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

xxx