Geçtiğimiz hafta OpenAI yeni nesil modelini tanıttı: GPT-5.6. Ama “tanıttı” derken kelimenin tam anlamıyla sadece tanıtım yazısını gördük, modeli kullanamadık. Çünkü GPT-5.6 şu an yalnızca sınırlı bir önizleme aşamasında. API ve Codex üzerinden, OpenAI’ın seçtiği küçük bir gruba açık. Tıpkı Anthropic’in ilk Mythos modelini tanıttığı gibi. Bayağı bayağı dejavu hissi yaşıyoruz. Bu tanıtım makalesinde neler yapabildiğini kendi anlatımları ile okuyoruz ve fiyatlarını görüyoruz.
Zaten asıl ilginç olan da o fiyat etiketi.
Üç model, üç kademe
OpenAI bu sürümle birlikte isimlendirmeyi de değiştirdi. Artık sayı (5.6) nesli, isim ise kalıcı bir yetenek kademesini gösteriyor:
Sol: Amiral gemisi, en güçlü model.
Terra: Günlük iş için dengeli orta seviye.
Luna: Hızlı ve ucuz giriş seviyesi.
Fiyatlandırma (1M token başına, girdi / çıktı):
Sol: $5 / $30
Terra: $2.50 / $15
Luna: $1 / $6
İşte burada durup karşılaştırma yapmak lazım, çünkü bu üç rakam aslında OpenAI’ın yeni stratejisini anlatıyor.
Sol: Opus ile aynı kulvarda
Sol’un fiyatı ($5 girdi / $30 çıktı) neredeyse doğrudan Anthropic’in amiral gemisi Claude Opus 4.8’i ($5 / $25) hedefliyor. Girdi tarafında birebir aynı, çıktıda ise Sol bir tık daha pahalı. Yani OpenAI üst segmentte fiyatı düşürmek yerine “rakibimle aynıyım” diyor. Buradaki rekabet fiyattan çok yetenek üzerinden yürüyor. Özellikle kodlama, biyoloji ve siber güvenlik benchmark’larında.
Terra: sessiz kahraman
Terra ($2.50 / $15) belki de en akıllıca konumlanmış model. OpenAI’ın kendi ifadesiyle Terra, önceki nesil GPT-5.5 ile yarışabilecek bir performans sunarken iki kat daha ucuz. Bu, “geçen ayın amiral gemisini bu ayın orta segment fiyatına” pazarlaması. Açıkçası maliyetin sektörde gitgide daha çok konuşulduğu bir dönemde tam isabet diyebiliriz.
Luna: Çin’e doğru bir adım
Asıl dikkat çeken kademe Luna ($1 / $6). Bu, OpenAI’ın bugüne kadar verdiği en agresif fiyat ve niyet açık: ucuz model pazarında Çinli rakiplerle kapışmak.
Ama burada dürüst olalım. Luna, Çinli modellere yaklaşıyor; onları yakalamıyor. Kıyas için DeepSeek tarafına bakalım: DeepSeek V4 Pro $1.74 / $3.48, V4 Flash ise $0.14 / $0.28. Luna’nın girdi fiyatı ($1) V4 Pro’nun altında. Bu gerçekten etkileyici. Ama asıl ucuz olan Çin kademesi, yani V4 Flash, hala Luna’dan girdi tarafında yaklaşık 7 kat, çıktı tarafında yaklaşık 20 kat daha ucuz.
Bir de son haftaların moda modeli var: Z.ai‘nin GLM 5.2’si. Fiyatı $1.40 / $4.40. Karşılaştırma kafa karıştırıcı biçimde başa baş: Luna girdide daha ucuz, GLM ise çıktıda belirgin biçimde daha ucuz, ki çıktı çoğu iş yükünde faturanın asıl belirleyicisi. Yani saf token fiyatında Luna ile GLM 5.2 aynı kulvarda, hatta toplamda GLM bir tık önde.
Özetle Luna, “Batılı bir modelden bu fiyatı görmek şaşırtıcı” dedirtiyor; ama Çin cephesi hala biraz daha ucuz. OpenAI bu boşluğu kapatmaya çalışıyor, henüz kapatmış değil.
Yeni hamle: Jalapeño
Hemen bir parantez açalım: bu fiyatların bugün düşük olması bir maliyet mucizesi değil, stratejik bir tercih. OpenAI bu modelleri hala büyük ölçüde Nvidia GPU’ları üzerinde, muhtemelen negatif kar marjı ile servis ediyor. Pazar payı için kıran kırana bir rekabet ortamındayız. Bugünkü fiyatları açıklayan şey çip değil, bu rekabet.
İşin geleceğe bakan kısmı ise ayrı. OpenAI aynı günlerde Broadcom ile geliştirdiği kendi çipini tanıttı: Jalapeño. Bu, eğitim için değil, doğrudan çıkarım (inference) için tasarlanmış özel bir çip. Çip henüz üretimde değil. İlk ürünlerin 2026 sonunda çalışmaya başlaması, asıl yaygınlaşmanın ise 2027’yi bulması öngörülüyor. Yani bugünkü fiyatlarla doğrudan bir ilgisi yok.
Önemi şurada: inference, her isteğin maliyetini belirleyen kısım. Genel amaçlı GPU yerine kendi iş yüküne göre tasarlanmış özel bir çip kullanırsan performansın artar, birim maliyetin düşer. Jalapeño devreye girdiğinde, bugün tercihle verilen bu agresif fiyatların karlı biçimde sürdürülebilir hale gelmesini sağlayabilir.
Ama madalyonun diğer yüzüne de bakmak lazım. Darboğaz artık GPU’da değil, bellekte. Sektörün uzun süredir konuştuğu “GPU kıtlığı” hikayesi, yerini “bellek kıtlığı”na bırakıyor. Çünkü çıkarımda (inference) token üretmek, bir hesaplama probleminden çok bir veri taşıma problemi. Daha fazla hesaplama bunu çözmüyor; daha fazla bellek ve bellek bant genişliği gerekiyor. Nitekim Jalapeño’nun tanıtımında öne çıkan da ham hesaplama gücü değil, “veri hareketini azaltmak”tı.
Ve asıl sıkışık nokta tam burası. Yüksek bant genişlikli bellek (HBM) 2026 boyunca fiilen tükenmiş durumda. Böyle olunca fiyatları da uçtu. Bu belleklerin üretimi yalnızca üç şirketin (SK Hynix, Samsung, Micron) elinde. Jalapeño da sonuçta HBM’e muhtaç. Yani OpenAI yarın kendi çipiyle GPU bağımlılığını azaltsa bile, kıt ve pahalı kaynak bir kademe aşağıya, yani belleğe, kaydığı için bu baskıdan tümüyle kurtulmuş olmayacak.
Peki neden kullanamıyoruz?
Fiyatı gördük ama modeli kullanamıyoruz. Sebebi de teknik değil, jeopolitik. 26 Haziran’da OpenAI, GPT-5.6’ya başlangıçta kimin erişeceğine ABD hükümetinin karar vereceğini açıkladı. Bu önizleme süresi boyunca erişim ABD hükümeti tarafından onaylanıyor. Sebep şu: Washington frontier modelleri artık fiilen bir ihracat kontrolü kalemi gibi görüyor. Aynı sorunu Anthropic de yaşadı; Mythos 5 ve Fable 5 ABD vatandaşı olmayanlara kapatılmıştı. Yani bu üç kademeli cazip fiyat listesi şimdilik çoğumuz için kağıt üzerinde.
Sonuç
GPT-5.6’nın asıl haberi yeteneklerden çok fiyat tablosu. Sol Opus’la aynı hizada, Terra geçen yılın gücünü yarı fiyata, Luna ise OpenAI’ı ilk kez Çin’in fiyat seviyesine yaklaştırıyor. Bugün bu rakamlar bir rekabet tercihi, ama yarın Jalapeño gibi kendi çipiyle sürdürülebilir hale gelebilir. Yeter ki kıtlık, GPU’dan kaydığı bellekte yeni bir duvar örmesin. Tabii bunları konuşurken bir ironiyi de atlamayalım. Yapay zekâ hiç bu kadar ucuz olmamıştı, ama frontier seviyesinde erişimi de hiç bu kadar zor olmamıştı.


