Klavyeye Elveda: OpenAI ve Jony Ive'ın Ses Devrimi
Ekranlara ve Klavyelere Karşı Savaş Başladı
Bilgisayarın ilk icadından bu yana klavye hep temel girdi aygıtı oldu. Hatta bu girdi aygıtını daha hızlı kullanabilmek için değişik yerleşimler (Q, F, A vs.) ve değişik biçimler denendi. Bazen fiziksel oldu, bazen dokunmatik. Ama hep önemini korudu. Sanırım artık bu günlerin sonuna gelmek üzereyiz.
Uzun yıllardır klavyenin bilgisayara komut verme ya da veri girme konusunda yavaş olduğunu biliyoruz. Bunu hızlandırmak için yanına konulan mouse da çok etkili oldu diyemeyiz. Bunun tek alternatifinin sesle komut verme olduğu aslında çok net bilinen bir gerçek. Ama bugüne kadar bunu verimli kullanamadık (Örnek: Siri). Yapay zekâ bu durumu değiştirmek üzere.
OpenAI, Donanım ve Yeni Modeller
OpenAI bu konuda çalışmalarını hızlandırdı. İki koldan klavyenin kullanımını azaltmayı düşünüyor. Öncelikle Jony Ive’ın şirketini 6,5 milyar dolara satın alarak bir donanım geliştireceğini ilan etmişlerdi. Ama o cihaz bir türlü tanıtılmadı. Hatta bilgi sızıntısı bile olmadı. Acaba vazgeçildi mi diye düşündük. Bunca beklenti sonrası ufak bilgi kırıntılarına ulaştık diyebiliriz.
Kod adı “Gumdrop” olan bu cihaz, akıllı telefon veya bilgisayarı tamamlayacak bir “üçüncü ana cihaz” olarak planlanıyor. Hatta Sam Altman, prototipin son halini “basit ve güzel” olarak tanımlıyor. Altman, kullanıcıların düşünmeden ellerine alıp kullanmak isteyecekleri bir form faktörü hedeflediklerini de söylüyor. Foxconn tarafından muhtemelen Vietnam’da üretilecek bu cihazı, bu sene sonlarına doğru kullanmaya başlayabiliriz gibi duruyor.
Asıl konuya gelelim. OpenAI, teknoloji dünyasında “ekranlara ve klavyeye karşı savaş” olarak adlandırılan yeni bir dönemin öncülüğünü yapıyor. Şirket, ChatGPT’nin sadece ses desteğini iyileştirmekle kalmayıp, teknolojiyle etkileşim biçimimizi kökten değiştirecek ses öncelikli (audio-first) modellere devasa yatırımlar yapıyor. Bugüne kadar OpenAI’ın ürettiği yapay zekâ modelleri öncelikle metin ve görsel öncelikli modellerdi. Yeni ses öncelikli modelleri bu yıl içinde tanıtacak.
Ses Modellerindeki Teknik Devrim
OpenAI’ın geliştirdiği yeni ses modelleri, mevcut yapay zekâ sistemlerinden çok daha ileri bir doğal etkileşim vaat ediyor. En dikkat çekici özelliklerden biri, örtüşen konuşma (overlapping speech) yeteneğidir; yani yapay zekâ, kullanıcı konuşurken aynı anda konuşabilecek ve araya girmelerle gerçek bir sohbette olduğu gibi akıcı bir şekilde ilerleyebilecek. Mevcut sesli özelliklerin aksine, bu yeni modellerin çok daha doğal, etkileyici ve detaylı yanıtlar üretmesi bekleniyor. Ayrıca bu modellerin bağlam farkındalığına sahip olması, yani kullanıcıyı ve çevresini anlayarak sadece bir yapay zekâ aracı gibi değil, bir “arkadaş” gibi çalışmasını sağlayacak.
Neden Ses?
OpenAI ve Jony Ive’ın vizyonunun arkasında derin bir felsefi neden yatıyor: Ekran bağımlılığını azaltmak. Ive, ses odaklı tasarımı, geçmişteki tüketici cihazlarının (akıllı telefonlar gibi) yarattığı bağımlılıktan, yani insanları ekranlara hapseden durumdan kurtarmak için bir fırsat olarak görüyor. Teknoloji sektöründe genel eğilim de ekranların ve klavyelerin arka plana itildiği, sesin ise merkez sahneye çıktığı bir geleceğe doğru. Amaç, insanların yapay zekâ ile tıpkı bir insanla konuşur gibi, en doğal, sezgisel ve hızlı yöntem olan sesle iletişim kurması.
Ses Modellerinin Gelecekteki Önemi
Sesin geleceğin ana arayüzü olacağına inanan OpenAI, bu hamlesiyle Meta’nın akıllı gözlükleri veya Tesla’nın Grok entegrasyonu gibi rakiplerinin sunduğu sesli asistan vizyonunu bir adım öteye taşımayı planlıyor. Bu modellerin başarısı, yapay zekânın sadece bir yazılım olmaktan çıkıp, dünyayı bizimle birlikte deneyimleyen ve bize anlık olarak rehberlik eden görünmez bir asistan haline gelmesini sağlayabilir.
Özetleyecek olursak, bugüne kadar yapay zekâ ile iletişimimiz, camın (ekranın) arkasındaki birine not yazıp cevap beklemek gibiydi. OpenAI’ın yeni ses modelleri ise o camı tamamen ortadan kaldırmayı ve yapay zekâyı yanımızda yürüyen, bizi dinleyen ve neredeyse bizimle aynı anda nefes alan canlı bir sohbet arkadaşına dönüştürmeyi vaat ediyor. Tabii burada oluşabilecek mahremiyet konularını, ürün ortaya çıktığında tartışmak üzere buraya not ediyorum.
Burada Apple’ın elindeki pazarlama gücünü ve donanım ekosistemini unutmamak gerekir. OpenAI’ın geliştirdiği bu ses modelleri ile birlikte Siri gerçekten beklenen noktaya gelebilir. Tabii OpenAI’ın elindeki bu teknolojik ürünü Apple ile ne kadar paylaşacağı veya Apple’ın gizlilik ve güvenlik bariyerini ne kadar indireceği hep birlikte göreceğiz.
Eski Güzel Günler
Evet, yapay zekâ klavyeyi de tarihin tozlu sayfalarına bir anı olarak kaydedecek. Biz de torunlarımıza fotoğraflarımızı gösterip anlatacağız: “Aaah yavrum ah, bak bu klavyeye dokunarak saatlerce kod yazıyorduk.” Bir nesil sonrası şu anlatılanlara nasıl şaşıracak, düşünemiyorum.
Bir sonraki yazıda görüşmek üzere…
Kaynaklar
“OpenAI bets big on audio as Silicon Valley declares war on screens”.Tech Crunch. https://techcrunch.com/2026/01/01/openai-bets-big-on-audio-as-silicon-valley-declares-war-on-screens/
“AI device startup that sued OpenAI and Jony Ive is now suing its own ex-employee over trade secrets”. The Business Journal. https://thebusinessjournal.com/ai-device-startup-that-sued-openai-and-jony-ive-is-now-suing-its-own-ex-employee-over-trade-secrets/
“OpenAI’s first device may rely on audio-based interactions: What to expect”. Business Standard. https://www.business-standard.com/technology/tech-news/openai-s-first-device-may-rely-on-audio-based-interactions-what-to-expect-126010500515_1.html


