
Çin merkezli yapay zekâ şirketi DeepSeek, yeni nesil dil modeli DeepSeek-R2’yi iddialara göre 15-30 Ağustos tarihleri arasında sürmeye hazırlanıyor. Bu tarih aralığı, şirketin kendi yapay zekâsıyla yapılan bir sohbet sırasında ortaya çıktı ve şirket GPT-5'e misilleme yapmak istiyor.
DeepSeek-R2, önceki sürüme göre çok daha gelişmiş bir yapıya sahip olacak. “Mixture of Experts” adı verilen daha akıllı bir sistem ve iş yükünü daha iyi yöneten yeni bir ağ kullanacak. Parametre sayısı 1,2 trilyona kadar çıkacak ve bu, DeepSeek-R1’in neredeyse iki katı. Yine de ChatGPT-4/5’in 1,8 trilyon parametresinin biraz gerisinde kalacak.
DeepSeek-R2, GPT-4'ün maliyetinin sadece %3'üyle eğitildi
En dikkat çekici noktalardan biri, modelin tamamen Huawei’nin yerli Ascend 910B çipleri ile eğitilmiş olması. Huawei’nin çip kümesi, NVIDIA A100’lere yakın performans veriyor. Bu adım, Çin’in ABD yapımı çiplere olan bağımlılığını azaltma planında önemli bir kilometre taşı. Bu sebeple DeepSeek-R2 Çin genelide oldukça önemli.
Üstelik DeepSeek-R2’nin eğitimi, GPT-4’ün maliyetinin sadece %3’üne mal oldu. Bu da API erişiminin çok daha ucuz olabileceği anlamına geliyor ve bu durum OpenAI ve Anthropic gibi devlerin fiyat politikasını zorlayabilir. Lansmana yönelik çıkan haberler de Çin borsasında hareketlilik yarattı. Yapay zekâ çip üreticisi Cambricon’un hisseleri arttı ve şirketin değeri 355 milyar yuanı geçti.
Kaynak: WEBTEKNO.COM