Deepseek yang mengejutkan model AI yang murah mencabar norma industri. Walaupun Deepseek mempunyai kos latihan hanya $ 6 juta untuk model DeepSeek V3, penampilan yang lebih dekat mendedahkan pelaburan yang jauh lebih besar.
imej: ensigame.com
DeepSeek V3 memanfaatkan teknologi inovatif termasuk Ramalan Multi-Token (MTP) untuk ketepatan dan kecekapan yang dipertingkatkan, campuran pakar (MOE) menggunakan 256 rangkaian saraf untuk latihan dipercepat, dan perhatian laten multi-kepala (MLA) untuk pengekstrakan maklumat yang lebih baik. Kemajuan ini menyumbang kepada prestasi kompetitifnya.
imej: ensigame.com
Walau bagaimanapun, semianalisis menemui infrastruktur pengiraan besar -besaran: kira -kira 50,000 NVIDIA Hopper GPU, termasuk 10,000 H800, 10,000 H100, dan unit H20 tambahan, tersebar di pelbagai pusat data. Infrastruktur ini, bernilai kira -kira $ 1.6 bilion dengan perbelanjaan operasi $ 944 juta, dengan ketara bercanggah dengan tuntutan kos latihan $ 6 juta.
imej: ensigame.com
DeepSeek, anak syarikat High-Flyer, dana lindung nilai Cina, memiliki pusat datanya, menyediakan kawalan dan inovasi yang lebih cepat. Status yang dibiayai sendiri meningkatkan ketangkasan. Gaji tinggi, melebihi $ 1.3 juta setiap tahun untuk beberapa penyelidik, menarik bakat Cina.
imej: ensigame.com
Angka $ 6 juta hanya mewakili kos GPU pra-latihan, menghilangkan penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Jumlah pelaburan AI DeepSeek melebihi $ 500 juta. Walaupun struktur kurus memupuk kecekapan, naratif "bajet revolusioner" adalah mengelirukan. Kos sebenar jauh lebih tinggi, walaupun masih berpotensi lebih rendah daripada pesaing. Sebagai contoh, model R1 DeepSeek berharga $ 5 juta, berbanding $ 100 juta ChatGPT4O. Kejayaan DeepSeek berpunca daripada pelaburan yang besar, kejayaan teknologi, dan pasukan mahir, bukan semata -mata anggaran yang rendah. Walau bagaimanapun, kosnya masih jauh lebih rendah daripada pesaingnya.