YAZI: MEHTAP DEMİR
Bilim insanı, yazar ve girişimci Gary Marcus, yapay zeka alanında dünyadaki en etkili isimlerden biri… 2016’da Uber tarafından satın alınan makine öğrenimi şirketi Geometric Intelligence’ın ve Robust.AI’ın da kurucusu olan Marcus, ‘The Algebraic Mind’, ‘Kluge’, ‘The Birth of the Mind’ ve New York Times çok satanlar listesinde yer alan ‘Guitar Zero’ gibi önemli eserleriyle de tanınıyor.
En son yayımladığı kitabı Ernest Davis ile birlikte yazdığı ‘Rebooting AI’, yapay zeka alanında okunması gereken kitaplardan biri olarak öne çıktı. Şu anda NYU’da profesör olarak görev yapan Gary Marcus, çıktığı günden bu yana dünyayı kasıp kavuran DeepSeek hakkındaki öngörülerini Fast Company için paylaştı…
EN BÜYÜK FARKI NE?
Henüz yolun çok başında ve kimse DeepSeek’in ne kadar ileri gidebileceğini tam olarak bilmiyor. Fakat bu aşamada en önemli farkı ‘ucuz’ olmasında. DeepSeek, diğer modellere göre çok daha ucuz bir şekilde eğitilebiliyor. Ancak, bu, çok daha “akıllı” olduğu anlamına gelmiyor. Büyük dil modellerinin uzun zamandır sahip olduğu “güvenilirlik” ve “doğruluk” gibi birçok problemi (örneğin makine halüsinasyonlarını) o da henüz çözemiyor. Dolayısıyla, bu aşamada sadece bu modellerin eğitimini daha ucuz hale getiriyor ve bu da başlı başına büyük bir etki yaratıyor.
DEEPSEEK BALON DEĞİL
Herkesin DeepSeek’in getirdiği bu yeni modeli/teknikleri kullanacağını düşünüyorum. Bir süre insanlar buna inanmadı, bazıları bunu sadece Çin’den çıkma bir “balon/hype” olarak gördü. Ama şu anda, hatta bu röportajdan dakikalar önce Meta’nın bu teknikleri kullanmayı planladığını öğrendim. Dolayısıyla, bu yeni tekniklerin geçerli olduğunu düşünüyorum ve iş dünyasını etkileyeceğini öngörüyorum. Kısa vadede en büyük etkisi fiyatları düşürmesi olacak çünkü herkes bu yaklaşımı benimseyecek. Şu anda bir fiyat savaşı içindeyiz… En az iki farklı ülkede, özellikle Avrupa’da, aynı teknolojiyi inşa etmeye çalışan onlarca şirket var. Herkes pazar payı istiyor ve bu payı elde etmenin en kolay yolu da fiyatlarla rekabet etmek çünkü kimsenin belirgin bir teknik avantajı yok.
ÇİP ÜRETİCİLERİNE ETKİSİ
Fiyatların düşmesi NVIDIA gibi şirketleri de etkileyecek. NVIDIA’nın hisse senedi fiyatları daha şimdiden bu yüzden düşüş gösterdi, çünkü artık aynı işleri yapabilmek için daha ucuz donanımlar kullanılabiliyor. NVIDIA, çok güçlü çiplere büyük yatırımlar yapmıştı, ancak bu yeni tekniklerle bu çiplere olan ihtiyaç azalabilir ya da rolü değişebilir. Huawei’inkiler gibi daha ucuz çipler daha rekabetçi hale gelebilir, NVIDIA ile AMD gibi şirketlerin daha ucuz çipleri de yeterli olabilir. Tüm bu gelişmelerin birçok ekonomik etkisi var. Uzun vadede, bu ucuz modeller daha fazla insanın bu alanda iş yapmasına imkân tanıyabilir. Bu da yapay zeka monopolilerinin gücünü zayıflatabilir ve daha küçük oyuncuların oyuna girmesini sağlayabilir.
SÜRDÜRÜLEBİLİRLİK ETKİSİ
Son birkaç ayda gördüklerimize göre, en azından ‘eğitim’ aşamasında çevresel etkiyi azaltıyor. Ancak “test” ya da “inference” (gerçek dünya verileriyle çalışıp tahminler veya sonuçlar üretme süreci) kısmına çok fazla etkisi yok. Uzun bir süre boyunca, insanlar daha fazla veri eklemenin yapay genel zekaya (AGI) ulaşmanın anahtarı olacağını düşünmüşlerdi. Ancak, bu beklenti gerçekleşmedi ve zaman içinde, daha fazla verinin, modelin performansına sağladığı iyileşmelerin azaldığını gördük. Şu anda da daha fazla zaman harcayarak cevap geliştiren modellere doğru bir kayma var ama bu yöntem hâlâ ucuzlamış değil. Modeli inşa etmek daha ucuz, ama çalıştırmak hâlâ pahalı. Bu nedenle, maliyetler üzerindeki etki genellikle eğitim aşamasında oluyor; söylediğim gibi ‘inference’ kısmı ise hâlâ pahalı. Bunun uzun vadede değişmesi mümkün olabilir, ama şu an belirsizliğini koruyor.
Genel olarak, bu modeller henüz optimal seviyede değil ve büyük ihtimalle geliştirilebilirler. Umarım bu da enerji verimliliği konusunda yardımcı olur. Ama hâlâ, “en büyük/lider olma” gibi piyasa baskısı altında oldukları için enerji tüketimi de yüksek kalıyor. Dolayısıyla enerji üzerinde yaratacağı etkileri şu aşamada net bir şekilde açıklamak zor çünkü süreç hâlâ gelişiyor.
STARTUP’LAR NE YAPACAK?
Bence bu gelişmeler yapay zekayı daha “erişilebilir” hale getirecek. Yapay zekanın kalitesini doğrudan iyileştirmiyor ama eğitim ve çalışma maliyetlerini düşürdüğü için daha fazla oyuncunun bu alanda yer almasını sağlayacak. Tabii bunun yanında, örneğin, SoftBank’in kurucusu Masayoshi Son’ın OpenAI’ye yaptığı 20 milyar dolarlık yatırım gibi büyük yatırımlar, ekonomik denklemi değiştirebilir.
Bence şu anda bu alandaki insanların çoğu gerçekten doğru yaklaşımla hareket etmiyor; ya da çok azı doğru yaklaşıma sahip. Büyük dil modellerinin ekonomisi değişiyor, ama bence nihai kazanç, “kutunun dışında düşünen” birinden gelecek. Şu anda herkes “aynı yöne” bakıyor ve bu alan giderek daha rekabetçi bir hâle geliyor. Bence bu alanda kimsenin şu anda çok para kazanması pek mümkün değil. Yapay zeka henüz yeterince gelişmiş değil. Ancak, yapay zekanın geleceğini farklı bir şekilde düşünen biri için gerçek bir fırsat var.
DEEPSEEK YAPAY ZEKANIN SINIRLARINI ZORLAYACAK MI?
- Evet ve hayır. Bir yandan, daha fazla kişinin denemesi için daha ucuz hale getiriyor. Ama hâlâ çözülmesi gereken önemli problemler var.
- Bu teknoloji, matematik gibi daha belirli alanlarda iyi çalışıyor. Ancak, gerçek dünya problemleri çok daha karmaşık ve öngörülemez. Bu da DeepSeek’in güçlü olduğu bir alan değil.
- Örneğin, sürücüsüz araçlar için bir demo yapmak kolay, ama araçları gerçek dünya koşullarındaki belirsizliklere dayanacak kadar güvenilir hale getirmek çok zor.
- Bu tür problemler, DeepSeek veya başka şirket tarafından henüz çözülmedi. Belki bu teknoloji başka bir şekilde ilerlemeyi mümkün kılacaktır, ama gerçek dünyanın karmaşık sorunlarını çözme konusunda hâlâ gidilecek çok yol var.
DEEPSEEK’İN MALİYET FARKI
20-40’ta 1’i fiyatla işlem yapıyor.
Kaynak: Bernstein Research
- 0.55 DOLAR: DeepSeek’in piyasaya sunduğu modellerin fiyatları, OpenAI’ın eşdeğer modellerine göre çok daha ucuz. Akıl yürütme modeli R1, girilen her token için 0.55 dolar tutarken, OpenAI’ın benzer modeli aynı sayıda token için 15 dolar ücret alıyor…
ÜÇ BÜYÜK YENİLİK
- BOYUT: Modelleri daha küçük hale getirmekte iyi iş çıkardılar.
- ÇİP: Tüm bu işi, pahalı NVIDIA çiplerine ihtiyaç duymadan başardılar.
- MALİYET: Her şeyi çok daha ucuz hale getirdiler.