โมเดล AI ราคาไม่แพงอย่างน่าประหลาดใจของ Deepseek ท้าทายบรรทัดฐานของอุตสาหกรรม ในขณะที่ Deepseek มีค่าใช้จ่ายในการฝึกอบรมเพียง $ 6 ล้านสำหรับรุ่น Deepseek V3 แต่การมองอย่างใกล้ชิดเผยให้เห็นการลงทุนที่สำคัญยิ่งขึ้น
IMGP%Image: Ensigame.com
Deepseek V3 ใช้ประโยชน์จากเทคโนโลยีที่เป็นนวัตกรรมรวมถึงการทำนายหลายครั้ง (MTP) เพื่อความแม่นยำและประสิทธิภาพที่เพิ่มขึ้นการผสมผสานของผู้เชี่ยวชาญ (MOE) โดยใช้เครือข่ายประสาท 256 แห่งสำหรับการฝึกอบรมแบบเร่งและความสนใจแฝงหลายหัว (MLA) สำหรับการสกัดข้อมูลที่ดีขึ้น ความก้าวหน้าเหล่านี้มีส่วนช่วยในการแข่งขัน
IMGP%Image: Ensigame.com
อย่างไรก็ตาม Semianalysis ได้เปิดโครงสร้างพื้นฐานการคำนวณขนาดใหญ่: GPU Nvidia Hopper ประมาณ 50,000 ตัวรวมถึง 10,000 H800, 10,000 H100 และหน่วย H20 เพิ่มเติมกระจายไปทั่วศูนย์ข้อมูลหลายแห่ง โครงสร้างพื้นฐานนี้มีมูลค่าประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงาน 944 ล้านดอลลาร์ซึ่งขัดแย้งกับการเรียกร้องค่าใช้จ่ายในการฝึกอบรม 6 ล้านดอลลาร์อย่างมีนัยสำคัญ
IMGP%Image: Ensigame.com
Deepseek ซึ่งเป็น บริษัท ย่อยของ High-Flyer ซึ่งเป็นกองทุนป้องกันความเสี่ยงของจีนเป็นเจ้าของศูนย์ข้อมูลให้การควบคุมและนวัตกรรมที่เร็วขึ้น สถานะที่ได้รับการสนับสนุนตนเองช่วยเพิ่มความคล่องตัว เงินเดือนสูงเกิน $ 1.3 ล้านต่อปีสำหรับนักวิจัยบางคนดึงดูดความสามารถของจีนชั้นนำ
IMGP%Image: Ensigame.com
ตัวเลข $ 6 ล้านแสดงถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมการละเว้นการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน การลงทุน AI ทั้งหมดของ Deepseek มีมูลค่าสูงกว่า 500 ล้านดอลลาร์ ในขณะที่โครงสร้างแบบลีนส่งเสริมประสิทธิภาพการเล่าเรื่อง "การปฏิวัติงบประมาณ" นั้นทำให้เข้าใจผิด ต้นทุนที่แท้จริงนั้นสูงกว่าอย่างมีนัยสำคัญแม้ว่าอาจต่ำกว่าคู่แข่ง ตัวอย่างเช่นรุ่น R1 ของ Deepseek มีราคา $ 5 ล้านเทียบกับ $ 100 ล้านของ CHATGPT4O ความสำเร็จของ Deepseek เกิดจากการลงทุนที่สำคัญความก้าวหน้าทางเทคโนโลยีและทีมงานที่มีทักษะไม่ใช่เพียงงบประมาณต่ำเท่านั้น อย่างไรก็ตามค่าใช้จ่ายของมันยังคงต่ำกว่าคู่แข่งอย่างมีนัยสำคัญ