Son yılların en az önem taşıyan Nvidia bilançosunun ardından, bu sefer son dönemde sessiz şekilde gerçekleşen ancak oldukça yüksek önem taşıyan bazı AI modellerinden bahsetmek gerekiyor. Bu yeni çıkan modeller, Çin-ABD gerilimi açısından da büyük önem sahip.
Deepseek’in yeni çıkardığı güncellenmiş R1 modeli, yine muhteşem bir model oldu. Model, bağımsız ölçümlere göre Open AI o4 mini modelinin hemen altında yer alıyor. Farklı agentic denen spesifik becerilere de sahip olan model aynı zamanda son dönemde AI modellerinde gördüğümüz dikey genişlemeden çok yanal genişlemeyi de gösterdiği için önem arz ediyor. Modelin en çok dikkat çeken iki adet özelliği var, birincisi eğitim sürecinde Qwen modelinin de kullanılmış olması, ikincisi de modelin token üretiminde önceki modele göre görülen muazzam artış ve düşünme süresi. Qwen modelinin aktif bir şekilde kullanılmış olması, open source ekosisteminde bu iki şirketin ne kadar birbirlerinden destek alabildiğini gösteriyor çünkü open source ekosistemi içerisinde Qwen modelleri çok kritik yer tutuyorlar. Deepseek algoritmik süreç dediğimiz model tasarımlarında biraz daha önde, ancak iki şirket beraber çok daha başarılı işler çıkarıyorlar gibi görünüyor. Token üretimine baktığımızda ise şirket hala Gemini modellerinden daha az token üretimi ile işlerini hallediyor ancak önceki modele göre net şekilde daha uzun düşünen modeller görüyoruz. Bu aslında Jensen Huang’ın GTC konferansında üzerinde çok durduğu bir konuydu ve haklı olduğunu görüyoruz. Modeller düşünüyorlar ve düşünmenin işlem gücü tarafında bir karşılığı var.
İkinci konuşmaya değer model, biraz daha önce çıkmış olan yeni Qwen modeli. Alibaba, yeni çıkardığı Qwen modeli ile LLama modelinden net bir şekilde öne geçmiş gibi görünüyor. Network etkisi olarak baktığımızda zaten çok güçlü bir konumda olan Qwen modelleri, şimdi baskıyı iyice arttırmış durumda ve yarattıkları çok güçlü küçük modeller ile Llama’ya göre büyük avantajlar yaratıyor gibi görünüyor. Önümüzdeki aylarda Llama benzeri multi-model çıkardıkları zaman, yani ses ve görüntü ile de eğitilebilen model çıkardıklarında (artık sektörün Youtube videoları gibi kaynaklardan da model eğitme talebi çok yükseldi) Llama için işler biraz daha hararetli tartışılabilir. Qwen modellerinin aynı zamanda ABD’li AI startuplar arasında da çok sık kullanıldığını görüyoruz ki bu Çin’in planının tamamen başarılı gittiğini bizlere gösteriyor. Peki bunu nasıl yapıyorlar ve neden tüm Çin modelleri open source?
Open source taraf özellikle teknolojinin gelişimi açısından çok önem arz eden bir durum ve burada gerçek bir network ağına sahip olmak aslında teknolojinin en ağır topu olduğunu anlamına gelir. Çin için tartışılan ana avantajı ise para ödemeden kullanabildiğiniz modeller olduğu için ABD’lilerin genelde kapalı modellere yönelmesi ve Çin’in münferit zarar karşılığı Çin için kar yazan şirketler politikası. Ancak olay aslında bu kadarla sınırlı değil. Çin, hiçbir senaryo altında ABD’den tek bir veriyi bile hanesine çekebileceğine zaten inanmıyor, bunu yapsa bile hemen engellenecektir. Kapalı modellerin avantajı öncelikle güvenliktir ve verileriniz ile hızlı entegrasyon sayesinde daha güçlü ürünleşme becerisidir. Açık modeller ise zaten özelleştirilebilsin diye yaratılmış ürünlerdir. Ürünleşme gibi bir süreçte ve güvenlik ve entegrasyon olarak ABD Çin’e güvenemez, bu yüzden bu alana girmiyorlar. Ancak open source tarafta kapalı modellere göre çok büyük networkler kurmak mümkün ve aslında bu bir soft power. İleride ise Apple, Microsoft gibi şirketlere rakip birer işletim sistemi yaratılması için gereken zeminin de bir yandan hazırlandığını görüyoruz. Alibaba’nın yeni küçük modelleri Llama’ya tehdit olduğu gibi küçük modellerde başarılı olan Microsoft’a da alttan alta bir tehdit. Çin her geçen gün bu alanda gücünü arttırıyor ve çip kontrollerinin sertleşmesi bu resimde kesin gibi görünüyor. Çin’in open source modellerindeki gelişimini engellemek için ise internet ve hizmetler alanına engeller gelme ihtimali, teknoloji dünyasının gelişimi açısından bizi epey farklı konuları tartışmaya yöneltebilir.
Özetle Çin tehdidi tam gaz devam ediyor. Meta ve Microsoft şirketlerinin hisselerinde bu konuda çok ciddi bir vurdumduymazlık var, şirkete olan güvenimiz hardware tarafındaki gücü nedeni ile nefesi yetenin kazanacağı bu savaşta hala avantajlı konumda olmalarından geliyor ancak Çin modelleri adeta bir virüs gibi yayılıyor ve bu Llama gelişmini baltalayabilir. Teknoloji ve çip alanında Trump’ın aldığı kararlar çok sertleşerek gidebilir. Apple, Microsoft, Meta gibi ekosistemler artık tamamen AI alanındaki çabalarına jeopolitik gelişmelere bağlı olacaktır, gelişemeleri yakından takip etmek gerekiyor.
Daha önce Nvidia’nın muhakkak kamu tarafından desteklenmesi gerektiğini ve ABD’nin en kıymetli silahı olduğunu yazmıştık, Arap yardım adasından gelen haberleri bundan bağımsız değerlendirmemek gerekiyor. O bölgede kurulan mega veri merkezleri haberlerinin ardından bilançonun bir önemi zaten kalmamıştı ancak jeopolitik açıdan şuna dikkat çekmek istiyoruz; ABD lütfedip çiplerinden paylaşırken aynı zamanda o çiplerin Çin tarafından kullanılmayacağı konusunda da elini uzatmış oluyor. Bunun, ABD veri merkezleri kurulan ülkeler üzerinde güvenlik şemsiyesi tarafında siber alanda da bir karşılığı olacaktır ve Huawei çipler gelmeden ABD’nin burada global ayak izini hızlıca arttırması, koyacağı tüm vergilerden daha önemli olacaktır.
Utku Oktay Acundeğer