Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri normlarına meydan okuyor. Deepseek, Deepseek V3 modeli için sadece 6 milyon dolarlık bir eğitim maliyetine sahip olsa da, daha yakından bakıldığında çok daha önemli bir yatırım ortaya koyuyor.
%İmgp%resim: ensigame.com
Deepseek V3, gelişmiş doğruluk ve verimlilik için çoklu atılmış tahmin (MTP), hızlandırılmış eğitim için 256 sinir ağı kullanan uzmanların (MOE) ve geliştirilmiş bilgi ekstraksiyonu için çok başlı gizli dikkat (MLA) dahil olmak üzere yenilikçi teknolojilerden yararlanır. Bu gelişmeler rekabetçi performansına katkıda bulunur.
%İmgp%resim: ensigame.com
Bununla birlikte, SEMianaliz büyük bir hesaplama altyapısı ortaya çıkardı: 10.000 H800, 10.000 H100 ve ek H20 birimi dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'ları birden fazla veri merkezine yayıldı. 944 milyon dolarlık operasyonel giderlerle yaklaşık 1,6 milyar dolar değerinde olan bu altyapı, 6 milyon dolarlık eğitim maliyet iddiasıyla önemli ölçüde çelişiyor.
%İmgp%resim: ensigame.com
Bir Çin Hedge Fonu olan High-Flyer'in bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, kontrol ve daha hızlı yenilik sağlıyor. Kendi kendini finanse edilen statüsü çevikliği artırır. Bazı araştırmacılar için yılda 1,3 milyon doları aşan yüksek maaşlar, en iyi Çin yeteneklerini çekiyor.
%İmgp%resim: ensigame.com
6 milyon dolarlık rakam yalnızca eğitim öncesi GPU maliyetlerini, araştırmayı, arıtmayı, veri işlemeyi ve altyapıyı temsil etmektedir. Deepseek'in toplam AI yatırımı 500 milyon doları aşıyor. Yalın yapısı verimliliği teşvik ederken, "devrimci bütçe" anlatısı yanıltıcıdır. Gerçek maliyet önemli ölçüde daha yüksek, ancak potansiyel olarak rakiplerden daha düşük. Örneğin, Deepseek'in R1 modeli, ChatGpt4o'nun 100 milyon dolarına kıyasla 5 milyon dolara mal oldu. Deepseek'in başarısı, sadece düşük bir bütçe değil, önemli yatırımlar, teknolojik atılımlar ve yetenekli bir ekipten kaynaklanıyor. Bununla birlikte, maliyeti rakiplerinden önemli ölçüde daha düşüktür.