Le modèle d'IA de Deepseek est étonnamment bon marché remet en question les normes de l'industrie. Alors que Deepseek possède un coût de formation de 6 millions de dollars pour son modèle Deepseek V3, un examen plus approfondi révèle un investissement beaucoup plus substantiel.
Image: esigame.com
Deepseek V3 exploite les technologies innovantes, y compris la prédiction multi-token (MTP) pour une précision et une efficacité améliorées, le mélange d'experts (MOE) utilisant 256 réseaux de neurones pour une formation accélérée et une attention latente multi-tête (MLA) pour une meilleure extraction d'informations. Ces progrès contribuent à sa performance concurrentielle.
Image: esigame.com
Cependant, la semianalyse a révélé une infrastructure de calcul massive: environ 50 000 GPU Nvidia Hopper, dont 10 000 H800, 10 000 H100 et des unités H20 supplémentaires, réparties sur plusieurs centres de données. Cette infrastructure, évaluée à environ 1,6 milliard de dollars avec 944 millions de dollars de dépenses opérationnelles, contredit considérablement la demande de coût de formation de 6 millions de dollars.
Image: esigame.com
Deepseek, une filiale de High Flyer, un fonds spéculatif chinois, possède ses centres de données, fournissant un contrôle et une innovation plus rapide. Son statut autofinancé améliore l'agilité. Les salaires élevés, dépassant 1,3 million de dollars par an pour certains chercheurs, attirent les meilleurs talents chinois.
Image: esigame.com
Le chiffre de 6 millions de dollars ne représente que les coûts de GPU avant la formation, l'omettant de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement total total de l'IA de Deepseek dépasse 500 millions de dollars. Alors que sa structure maigre favorise l'efficacité, le récit du "budget révolutionnaire" est trompeur. Le coût réel est nettement plus élevé, bien que potentiellement inférieur à celui des concurrents. Par exemple, le modèle R1 de Deepseek a coûté 5 millions de dollars, par rapport aux 100 millions de dollars de ChatGPT4O. Le succès de Deepseek découle de l'investissement substantiel, des percées technologiques et d'une équipe qualifiée, et non uniquement d'un budget à bas. Néanmoins, son coût reste nettement inférieur à ses concurrents.