Il modello AI sorprendentemente economico di Deepseek sfida le norme del settore. Mentre DeepSeek vanta un costo di formazione di soli 6 milioni di dollari per il suo modello DeepSeek V3, uno sguardo più attento rivela un investimento molto più sostanziale.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative tra cui la previsione multi-dire (MTP) per una maggiore accuratezza ed efficienza, la miscela di esperti (MOE) utilizzando 256 reti neurali per la formazione accelerata e l'attenzione latente multi-testa (MLA) per una migliore estrazione di informazioni. Questi progressi contribuiscono alla sua performance competitiva.
Immagine: Ensigame.com
Tuttavia, la semianalisi ha scoperto un'enorme infrastruttura computazionale: circa 50.000 GPU della tramoggia Nvidia, tra cui 10.000 H800, 10.000 H100 e ulteriori unità H20, distribuite su più data center. Questa infrastruttura, valutata a circa $ 1,6 miliardi con $ 944 milioni di spese operative, contraddice in modo significativo il reclamo di costi di formazione da 6 milioni di dollari.
Immagine: Ensigame.com
DeepSeek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, fornendo controllo e innovazione più rapida. Il suo stato autofinanziato migliora l'agilità. Gli alti salari, superiori a $ 1,3 milioni all'anno per alcuni ricercatori, attirano i migliori talenti cinesi.
Immagine: Ensigame.com
La cifra di $ 6 milioni rappresenta solo costi di GPU pre-allenamento, omettere la ricerca, il raffinamento, l'elaborazione dei dati e l'infrastruttura. L'investimento totale di intelligenza artificiale di Deepseek supera $ 500 milioni. Mentre la sua struttura snella promuove l'efficienza, la narrazione del "bilancio rivoluzionario" è fuorviante. Il costo reale è significativamente più alto, sebbene potenzialmente più basso rispetto ai concorrenti. Ad esempio, il modello R1 di Deepseek è costato $ 5 milioni, rispetto ai $ 100 milioni di Chatgpt4o. Il successo di Deepseek deriva da investimenti sostanziali, scoperte tecnologiche e una squadra qualificata, non solo un budget basso. Tuttavia, il suo costo rimane significativamente inferiore ai suoi concorrenti.