El modelo de IA sorprendentemente económico de Deepseek desafía las normas de la industria. Mientras que Deepseek cuenta con un mero costo de capacitación de $ 6 millones para su modelo V3 Deepseek, un aspecto más cercano revela una inversión mucho más sustancial.
Imagen: Ensigame.com
Deepseek V3 aprovecha tecnologías innovadoras que incluyen predicción múltiple (MTP) para una mayor precisión y eficiencia, la mezcla de expertos (MOE) utilizando 256 redes neuronales para capacitación acelerada y atención latente de múltiples cabezas (MLA) para mejorar la extracción de información. Estos avances contribuyen a su rendimiento competitivo.
Imagen: Ensigame.com
Sin embargo, el semianálisis descubrió una infraestructura computacional masiva: aproximadamente 50,000 GPU de la tolva Nvidia, incluidas 10,000 H800, 10,000 H100 y unidades H20 adicionales, se extienden entre múltiples centros de datos. Esta infraestructura, valorada en aproximadamente $ 1.6 mil millones con $ 944 millones en gastos operativos, contradice significativamente el reclamo de costos de capacitación de $ 6 millones.
Imagen: Ensigame.com
Deepseek, una subsidiaria de High-Flyer, un fondo de cobertura chino, posee sus centros de datos, proporcionando control e innovación más rápida. Su estado autofinanciado mejora la agilidad. Los altos salarios, superiores a $ 1.3 millones anuales para algunos investigadores, atraen el mejor talento chino.
Imagen: Ensigame.com
La cifra de $ 6 millones solo representa los costos de GPU previos al entrenamiento, omitiendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de IA de Deepseek supera los $ 500 millones. Si bien su estructura magra fomenta la eficiencia, la narrativa del "presupuesto revolucionario" es engañosa. El verdadero costo es significativamente mayor, aunque aún potencialmente más bajo que los competidores. Por ejemplo, el modelo R1 de Deepseek costó $ 5 millones, en comparación con los $ 100 millones de CHATGPT4O. El éxito de Deepseek proviene de una inversión sustancial, avances tecnológicos y un equipo calificado, no solo un presupuesto bajo. Sin embargo, su costo sigue siendo significativamente más bajo que sus competidores.