दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग मानदंडों को चुनौती देती हैं। जबकि दीपसेक अपने डीपसेक वी 3 मॉडल के लिए केवल $ 6 मिलियन प्रशिक्षण लागत का दावा करता है, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
छवि: ensigame.com
दीपसेक वी 3 ने बढ़ी हुई सटीकता और दक्षता के लिए मल्टी-टोकन भविष्यवाणी (एमटीपी) सहित नवीन प्रौद्योगिकियों का लाभ उठाया, विशेषज्ञों का मिश्रण (एमओई) त्वरित प्रशिक्षण के लिए 256 तंत्रिका नेटवर्क का उपयोग करता है, और बेहतर सूचना निष्कर्षण के लिए मल्टी-हेड अव्यक्त ध्यान (एमएलए)। ये प्रगति इसके प्रतिस्पर्धी प्रदर्शन में योगदान करती हैं।
छवि: ensigame.com
हालांकि, सेमियालिसिस ने एक बड़े पैमाने पर कम्प्यूटेशनल बुनियादी ढांचे को उजागर किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू, जिसमें 10,000 एच 800, 10,000 एच 100 और अतिरिक्त एच 20 यूनिट शामिल हैं, कई डेटा केंद्रों में फैले हुए हैं। यह बुनियादी ढांचा, परिचालन खर्चों में $ 944 मिलियन के साथ लगभग 1.6 बिलियन डॉलर का मूल्य है, जो $ 6 मिलियन प्रशिक्षण लागत के दावे का काफी विरोध करता है।
छवि: ensigame.com
एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा केंद्रों का मालिक है, जो नियंत्रण और तेजी से नवाचार प्रदान करती है। इसकी स्व-वित्त पोषित स्थिति चपलता को बढ़ाती है। उच्च वेतन, कुछ शोधकर्ताओं के लिए सालाना $ 1.3 मिलियन से अधिक, शीर्ष चीनी प्रतिभाओं को आकर्षित करता है।
छवि: ensigame.com
$ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण जीपीयू लागत, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को छोड़ने का प्रतिनिधित्व करता है। दीपसेक का कुल एआई निवेश $ 500 मिलियन से अधिक है। जबकि इसकी दुबली संरचना दक्षता को बढ़ावा देती है, "क्रांतिकारी बजट" कथा भ्रामक है। वास्तविक लागत काफी अधिक है, हालांकि अभी भी प्रतियोगियों की तुलना में संभावित रूप से कम है। उदाहरण के लिए, Chatgpt4o के $ 100 मिलियन की तुलना में दीपसेक के R1 मॉडल की लागत $ 5 मिलियन है। दीपसेक की सफलता पर्याप्त निवेश, तकनीकी सफलताओं और एक कुशल टीम से उपजी है, न कि केवल कम बजट। फिर भी, इसकी लागत अपने प्रतिद्वंद्वियों की तुलना में काफी कम है।