Open AI tarafından yeni model güncellemesi geldi. GPT 1o, diğer adı ile “Strawberry” uygulaması dün tanıtıldı ve dünden itibaren premium üyelere kısmi kullanıma açıldı. Model gündelik kullanım için GPT 4o güncellemesinden çok büyük ayrışmalar yaşamıyor ancak çalışma mekanizasmasındaki farklar nedeniyle kompleks görevlerde çok ciddi bir fark yaratıyor
Yeni GPT’nin çalışma mantığı düşünme süreci dediğimiz bir boşluk vererek cevap vermesi ve bu süreçte karşısına çıkan sorunları “chain of thought” yönetimi ile kademelendirerek işe başlaması. Chain of thought zaten önceki videolarımızda bahsettiğimiz ve ileride modellerin kendilerinin de bunu promp engineering’e gerek duymadan yapabileceğini belirttiğimiz bir süreçti, soruların aşama aşama incelemek ve aşama aşama çözme yoluna girişmek olarak özetleyebiliriz. Dikkat çekici olan konu bence burada önceden zero shot öğrenme (herhangi bir girizgah veya bağlam sunmadan sorunun sorulması) üzerinden modellerin becerilerini yorumlarken ve oradan Chain of Thought konuşurken şimdi bu gündelik metriklerden çıkmamız oldu. Yani tamamen komplike görevler için tasarlanmış bir model bu ve ticari kullanım için de çok faydalı olacağı kesin
Modelin bir diğer enteresan özelliği ise sürekli olarak düşünme sürecinin kendisini geliştirip yenileyecek olması. Burada tam olarak bir güncel veri kullanımı üzerinden güncellenen veri tabanından bahsedilmiyor, Open AI tarafından paylaşılan grafiklerde daha çok işlem gücü tüketimi ve daha çok test ile beraber performansı yükselecek bir modelden bahsediyoruz, veri kapsamının genişlemesinden çok daha önemli bir konu bu, mantık süreçlerindeki verimi süreç içerisinde sürekli ileriye götürmek, aynı zamanda Open AI’ın çok başarılı bir başlangıç yapan Enterprise hizmetlerini de çok daha ileri seviyeye götürecektir
Bu model ile beraber önceki günlerde çıkan LLama Reflection mekanizmasından da bence çok kısa bahsetmek gerekiyor. LLama modeli de düşünme süreçlerinde kendi kendini düzelten ve yenileyen, bu süreçleri karşı taraf ile paylaşan, Reflection adı verilen bir mekanizmayı modellerine ekledi. Bu sayede gecikme süresi 1o modelindekine benzer şekilde artacak ancak kompleks görevlerde daha verimli bir model haline gelecek. Bu iki adımın ticari AI kullanım süreçleri için önemli olduğunu düşünüyorum ve Gen AI’ın ilk adımı olacağını tahmin ettiğim kurumsal verimlilik tarafında çok faydaları olacak. Bu adımlar beklentimden daha hızlı gidiyor, oldukça pozitif
1o, özellikle fizik, matematik, mantık gibi alanlarda gerçekten 4o modeline çok büyük bir fark atmış durumda. Kendi sosyal medya hesaplarında hali hazırda bir çok farklı sektör için kullanım örneklerinin ne kadar geliştiğini görebiliyoruz. Çok basit girdiler ile yılan oyunu tasarlama, sağlık sektöründeki kullanım alanları, kodlama tarafındaki basitlik ve olimpiyat matematik sorularına verdiği cevapların kalitesi. Bunların hepsini yapabilmesinin arkasında çok önemli bir mantık gelişimi yatıyor, kendi sitelerindeki teknik dökümanda sorular bazı kompleks sorulara nasıl bir mantık yolu ve farklı senaryolar ile cevap verdiğini, gittiği yol tıkanınca nasıl yol değiştirdiğini ve kompleks aşamaları nasıl basitleştirdiğini görebiliyoruz. AI, yavaş yavaş bir çok alandaki giriş bariyelerini de kaldırmaya başladı. 1o güncellemesinin çok önemli olduğunu düşünüyorum, şu anda güncel verileri ile çalışma süreci için biraz pahalı durumda, daha da ölçeklendikçe fiyatı da makul yerlere gelecektir
Marc Zuckerberg’in sürekli olarak üzerinde durduğu, daha yüksek işlem gücü talep eden modeller, tam olarak bu modeller
Utku Oktay Acundeğer