O modelo de IA surpreendentemente barato de Deepseek desafia as normas da indústria. Enquanto a Deepseek possui um mero custo de treinamento de US $ 6 milhões para seu modelo Deepseek V3, um visual mais próximo revela um investimento muito mais substancial.
Imagem: Ensigame.com
O Deepseek V3 aproveita tecnologias inovadoras, incluindo previsão de vários toques (MTP) para maior precisão e eficiência, mistura de especialistas (MOE) utilizando 256 redes neurais para treinamento acelerado e atenção latente de várias cabeças (MLA) para extração de informações. Esses avanços contribuem para seu desempenho competitivo.
Imagem: Ensigame.com
No entanto, a semiânica descobriu uma enorme infraestrutura computacional: aproximadamente 50.000 GPUs NVIDIA Hopper, incluindo 10.000 H800, 10.000 H100 e unidades H20 adicionais, espalhadas por vários data centers. Essa infraestrutura, avaliada em aproximadamente US $ 1,6 bilhão, com US $ 944 milhões em despesas operacionais, contradiz significativamente a reivindicação de custo de treinamento de US $ 6 milhões.
Imagem: Ensigame.com
A Deepseek, uma subsidiária da High-Flyer, um fundo de hedge chinês, possui seus data centers, fornecendo controle e inovação mais rápida. Seu status autofinanciado aumenta a agilidade. Altos salários, excedendo US $ 1,3 milhão anualmente para alguns pesquisadores, atraem os principais talentos chineses.
Imagem: Ensigame.com
O número de US $ 6 milhões representa apenas custos de GPU pré-treinamento, omitindo pesquisas, refinamento, processamento de dados e infraestrutura. O investimento total da AI da Deepseek ultrapassa US $ 500 milhões. Enquanto sua estrutura magra promove a eficiência, a narrativa do "orçamento revolucionário" é enganoso. O custo verdadeiro é significativamente maior, embora ainda potencialmente menor que os concorrentes. Por exemplo, o modelo R1 da Deepseek custou US $ 5 milhões, em comparação com os US $ 100 milhões da ChatGPT4O. O sucesso de Deepseek decorre de investimentos substanciais, avanços tecnológicos e uma equipe qualificada, não apenas um orçamento baixo. No entanto, seu custo permanece significativamente menor que seus concorrentes.