De Deepseek's verrassend goedkope AI -model daagt de industrienormen uit. Terwijl Deepseek slechts $ 6 miljoen trainingskosten heeft voor zijn Deepseek V3 -model, onthult een nadere blik een veel meer substantiële investering.
afbeelding: ensigame.com
Deepseek V3 maakt gebruik van innovatieve technologieën, waaronder multi-token voorspelling (MTP) voor verbeterde nauwkeurigheid en efficiëntie, mengsel van experts (MOE) met behulp van 256 neurale netwerken voor versnelde training en multi-head latente aandacht (MLA) voor verbeterde informatie-extractie. Deze vorderingen dragen bij aan de concurrentieprestaties.
afbeelding: ensigame.com
Semianyse heeft echter een enorme computationele infrastructuur aan het licht gebracht: ongeveer 50.000 Nvidia Hopper GPU's, waaronder 10.000 H800, 10.000 H100 en extra H20 -eenheden, verspreid over meerdere datacenters. Deze infrastructuur, met een waarde van ongeveer $ 1,6 miljard met $ 944 miljoen aan operationele kosten, is een aanzienlijk in tegenspraak met de trainingskostenclaim van $ 6 miljoen.
afbeelding: ensigame.com
Deepseek, een dochteronderneming van High-Flyer, een Chinees hedgefonds, bezit zijn datacenters en biedt controle en snellere innovatie. Zijn zelf gefinancierde status verbetert de behendigheid. Hoge salarissen, meer dan $ 1,3 miljoen per jaar voor sommige onderzoekers, trekken top Chinees talent aan.
afbeelding: ensigame.com
Het cijfer van $ 6 miljoen vertegenwoordigt alleen pre-training GPU-kosten, het weglaten van onderzoek, verfijning, gegevensverwerking en infrastructuur. De totale AI -investering van Deepseek overtreft $ 500 miljoen. Terwijl de magere structuur de efficiëntie bevordert, is het verhaal "revolutionaire budget" misleidend. De werkelijke kosten zijn aanzienlijk hoger, hoewel nog steeds potentieel lager dan concurrenten. Het R1 -model van Deepseek kost bijvoorbeeld $ 5 miljoen, vergeleken met de $ 100 miljoen van Chatgpt4o. Het succes van Deepseek komt voort uit substantiële investeringen, technologische doorbraken en een bekwaam team, niet alleen een laag budget. Desalniettemin blijven de kosten aanzienlijk lager dan zijn concurrenten.