GPT-5 Gerçekten Devrim mi, Yoksa Pazarlama Hilesi mi?
Şatafatlı Lansmanın Ardında Saklanan Hayal Kırıklığı
Geçtiğimiz hafta yazımı hazırlarken, yani Anthropic'in kurumsal kullanımda OpenAI'ı oldukça geride bıraktığını yorumlarken, OpenAI'ın yeni modeli GPT-5'in tanıtımının yapılacağı belliydi ve Sam Altman oldukça iddialı açıklamalarda bulunuyordu. Dolayısıyla yazıyı yazarken, acaba gerçekten bu vaatleri gerçek olursa rekabetin tekrar başlayabileceğini düşünmedim değil. Ama lansmanından sonra kullanıcıların yorumlarını okuyup kendim de bazı denemeler yapınca "dağ fare doğurdu" demekten kendimi alamadım. En son yazacağımı baştan yazayım. GPT-5, birkaç yıl sonra yeni bir iPhone almış gibi hissettirdi. Bir yandan, birçok boyutta önemli ölçüde geliştirilmiş olduğu söyleniyor; diğer yandan, hâlâ sadece bir iPhone.
Neler Vaat Edildi?
GPT-5 öncesi -belki de geeklerin gazını almak için- 2 tane açık kaynak model tanıtıldı. gpt-oss-120b ve gpt-oss-20b kodlu bu modelleri çok rahatça kendi bilgisayarınızda kullanabiliyorsunuz. Hakkını yemeyelim, bu güzel oldu. Özellikle gpt-oss-20b normal bir laptop'ta bile çalışabiliyor. Özel bir kart da istemiyor. Daha büyük model ise ister istemez bir Nvidia kartına ihtiyaç duyuyor. Yine de bunlar güzel gelişmeler.
OpenAI CEO'su Sam Altman, GPT-5'i "dünyanın en iyi modeli" olarak tanıttı. GPT-5'in temel vaatleri arasında önceki modellere göre önemli gelişmeler yer alıyor. Lansmanda OpenAI'dan Michelle Pokrass da GPT-5'in GPT-4'ten daha iyi olduğunu açıkça onayladı. Yine OpenAI'dan Eric Mitchell'e göre GPT-5, daha iyi muhakeme (düşünme), daha iyi yazma (yaratıcılık) gibi birkaç temel alanda GPT-4'ten fark attığını söyledi.
Lansmanda özellikle kodlama yeteneklerinin tüm rakiplerini geride bıraktığı üzerinde uzun uzun konuşuldu ve farklı test sonuçları kullanıcılara gösterildi.
Hayaller ve Gerçekler
GPT-5'in lansmanı sonrası tüm kullanıcılara açılması -ücretsiz üyeler dahil- herkesin kurcalamasına imkân sağladı. Aslında burada da bir teşekkürü hak ediyorlar. Böylece aylık 200 dolar ödeyen ve afedersiniz salak yerine konulmamak için "kral çıplak" diyemeyecek üyelerin yorumlarına maruz kalmadan herkes kendisi kullanıp değerlendirme şansına sahip oldu.
Genel kanaat, abartıldığı kadar iyi değil. Hatta Anthropic'in Sonnet 4'ünün bile arkasında olduğunu söylesek yanlış olmaz. Hatta GPT-5 lansmanı sonrası en büyük şikâyetlerden biri, GPT-4o, 4.1, 4.5 ve o3 gibi önceki modellerin kaldırılması oldu. Bunu neden yaptıkları belli değil.
Reddit platformunda Sam Altman'ın da katıldığı AMA (ask me anything) etkinliği de kullanıcıların şikâyetleri ile doldu taştı. Eski kullanıcılar, GPT-4o ile oluşturdukları iş akışlarının ve spesifik dinamiklerin yeni modelle bozulduğunu, hatta "yılların çalışmasının ve adanmışlığının boşa gittiğini" hissettiklerini belirttiler ki bu büyük bir sorun.
Hatta veri bilimci Colin Fraser, GPT-5'in temel matematik ve cebir problemlerini yanlış çözdüğünü (!) gösteren ekran görüntüleri paylaştı. Geliştiriciler de GPT-5'in bazı tek seferlik programlama görevlerinde Anthropic'in Claude Opus 4.1 modelinden daha kötü performans gösterdiğini söyleyerek Sam Altman'a öfkelerini dile getirdiler. Yani Reddit'teki bu etkinlik Altman için kabusa döndü.
Sorunların bir kısmının, kullanıcı isteklerini dört GPT-5 varyantından birine (normal, mini, nano ve pro) atayan yeni otomatik "yönlendirici" sisteminden kaynaklandığı açıklandı. Böylece ücretsiz kullanıcılara bile açılan GPT-5'i kullanmak isteyenler belli ki sınıflandırılıp farklı modellere yönlendirilmeye çalışıldı. Ama burada oluşan bir hata herkesi en küçük sürümlerden birine yönlendirmiş olabilir.
Benim Testlerim
Ben de bu yorumları okuduktan sonra kendi gözümle durumu görmek istedim. Basit sayılabilecek bir arayüz ve yine basit sayılabilecek bir kodlama görevinden oluşan 5 maddelik bir projeyi Windsurf üzerinden Anthropic Sonnet 4 ve GPT-5'e ayrı yaptırdım. Sonnet 4'ün hâlâ kodlama açısından en iyisi olduğunu kendim de gördüm. GPT-5'in Windsurf üzerinde ücretsiz olarak kullanılabildiği Low Reasoning modeli gerçekten kötü durumda. Ücret karşılığı kullanılan High Reasoning modeli ise daha iyi ama Sonnet 4'e göre başarısız. Elbette bu testle "iyidir" ya da "kötüdür" demem mümkün değil ama ben kısa vadede Sonnet 4'ten vazgeçmeyeceğim.
OpenAI'ın Stratejik Fiyatlandırması
Dikkat ederseniz OpenAI bu modeli herkese aynı gün açtı. Hatta basit varyantlar tamamen ücretsiz olarak da kullanılabiliyor. GPT-5 API'sinin giriş token'ları için milyon başına 1,25 dolar, çıkış token'ları için ise milyon başına 10 dolar ücretlendireceği açıklandı. Bu fiyatlandırma Google Gemini 2.5 Pro'ya yakın ancak Anthropic'in Claude Opus 4.1'inden önemli ölçüde daha ucuz; Claude Opus 4.1, milyon giriş token'ı için 15 dolardan ve milyon çıkış token'ı için 75 dolardan başlıyor. Hatta GPT-5, GPT-4o'dan bile daha ucuz. Bu fiyatlandırma stratejisi, büyük dil modelleri pazarında bir fiyat savaşı başlatma potansiyeli taşıyor. Belki de kaybettiği kurumsal pazarı tekrar elde etmek istiyor. Ama bunu sadece fiyat indirerek yapması biraz zor.
Söylediğine Değil, Yaptığına Bakarım
Sam Altman ve ekibi lansmanı öncesi beklentileri çok yüksek tuttular. Lansmanı, eski modellerin aniden kaldırılması ve algılanan performans düşüşü ile ilgili yoğun kullanıcı şikâyetleriyle gölgelendi. Firma da bunu kabul edip en azından GPT-4o'yu geri getirme sözü verdi. Evet, bu da olumlu bir yaklaşım. Ama görünen o ki OpenAI, yapay zekâ dünyasının Apple'ı durumuna düşmek üzere. Sürekli yükselen çizgi yatay bir hâle dönmüş durumda. Şatafatlı lansmanlar maalesef bunu örtmüyor. Bu gidişle kurumsal pazarı yeniden kazanmaları şöyle dursun, elinde kalanları da mundar edecek gibiler.
Bu konuda sizlerin görüşleri neler? Test etme şansınız oldu mu? Yorumlarınızı bekliyorum.
Bir sonraki yazıda görüşmek üzere.


