Yapay zeka dünyasında büyük şirketler yön değiştirmeye başladı. Devasa dil modelleri geliştirmek yerine, test-time compute adı verilen ve modelin yürütme aşamasında daha fazla işlem gücü kullanan bir yönteme odaklanıyorlar. Bu yeni yaklaşım, yapay zekaların yalnızca anlık cevaplar vermek yerine problemleri adım adım düşünmesine olanak tanıyor.
Ölçeklendirmede Tıkanma Noktası
Reuters’a göre, büyük yapay zeka laboratuvarları ölçeklendirmede sınırlara ulaşmaya başladı. Bu devasa LLM’lerin eğitimi milyonlarca dolara mal oluyor ve karmaşık sistemler sıkça arızalanıyor. Yeni bir modelin istenildiği gibi çalışıp çalışmadığını anlamak bile aylar alabiliyor. The Information da OpenAI’nin sıradaki büyük modeli Orion‘un GPT-4o’ya kıyasla ancak sınırlı bir gelişme gösterdiğini bildirdi.
Google ve Anthropic de benzer zorluklarla karşı karşıya. Google’ın Gemini 2.0 modeli ve Anthropic’in Opus 3.5 modeliyle ilgili çalışmalar ya durdurulmuş ya da yavaşlamış durumda. Anthropic CEO’su Dario Amodei, “doğru eğriyi bulmaya çalışıyoruz” diyerek, bu durumu doğruladı.
Sutskever’den Yeni Bir Yaklaşım: “Doğru Şeyi Ölçekleyin”
OpenAI kurucusu Ilya Sutskever, “2010’lar ölçeklendirme çağıydı, şimdi tekrar keşif ve hayranlık çağına döndük,” diyerek yeni bir döneme işaret etti. Artık önemli olanın “doğru şeyi ölçeklendirmek” olduğunu vurgulayan Sutskever, bir zamanlar savunduğu “büyüdükçe iyileşir” yaklaşımından uzaklaştığını belirtti. Mayıs ayında OpenAI’den ayrılarak kendi laboratuvarı olan Safe Superintelligence (SSI)‘ı kuran Sutskever, yeni bir ölçeklendirme paradigması denemek istediğini açıkladı.
Yeni Yaklaşımlar: Test-Time Compute
OpenAI CEO’su Sam Altman, Kasım ayı başında şirketinin yeni o1 modeli ve onun haleflerine odaklanacağını belirtti. OpenAI, Meta, Google DeepMind ve xAI gibi diğer büyük laboratuvarlar da benzer yöntemleri deniyor. Bu yöntemle modeller, hızlı cevaplar yerine birden fazla çözüm üretiyor, değerlendirme yapıyor ve en iyi çözümü seçiyor. Böylece yapay zekalar, adım adım düşünerek daha sağlam sonuçlara ulaşabiliyor.
Bu değişim, AI donanım dünyasında da önemli etkiler yaratabilir. Nvidia, grafik kartlarıyla büyük dil modellerinin eğitimi alanında lider olsa da, test-time compute‘un yaygınlaşması diğer çip üreticilerine de alan açabilir. Örneğin, Groq gibi şirketler bu tür işlemler için özelleşmiş çipler geliştiriyor.
Bu gelişmeler, yapay zekanın yalnızca daha güçlü değil, aynı zamanda daha düşünceli bir şekilde çalışmasına yönelik önemli adımlar olarak öne çıkıyor.
No responses yet