ডিপসেকের আশ্চর্যজনকভাবে সস্তা এআই মডেল শিল্পের নিয়মকে চ্যালেঞ্জ করে। যখন ডিপসেক তার ডিপসেক ভি 3 মডেলের জন্য মাত্র million মিলিয়ন ডলার প্রশিক্ষণ ব্যয়কে গর্বিত করে, একটি ঘনিষ্ঠ চেহারাটি আরও বেশি পরিমাণে বিনিয়োগের প্রকাশ করে।
%আইএমজিপি%চিত্র: ensigame.com
ডিপসেক ভি 3 বর্ধিত নির্ভুলতা এবং দক্ষতার জন্য মাল্টি-টোকেন প্রেডিকশন (এমটিপি) সহ উদ্ভাবনী প্রযুক্তিগুলি উপার্জন করে, বিশেষজ্ঞদের মিশ্রণ (এমইই) ত্বরান্বিত প্রশিক্ষণের জন্য 256 নিউরাল নেটওয়ার্কগুলি ব্যবহার করে এবং উন্নত তথ্য উত্তোলনের জন্য মাল্টি-হেডেন্টের সুপ্ত মনোযোগ (এমএলএ) ব্যবহার করে। এই অগ্রগতিগুলি এর প্রতিযোগিতামূলক পারফরম্যান্সে অবদান রাখে।
%আইএমজিপি%চিত্র: ensigame.com
যাইহোক, সেমিয়ানালাইসিস একটি বিশাল গণনামূলক অবকাঠামো উন্মোচিত করেছে: প্রায় 50,000 এনভিডিয়া হপার জিপিইউ, 10,000 এইচ 800, 10,000 এইচ 100 এবং অতিরিক্ত এইচ 20 ইউনিট সহ একাধিক ডেটা সেন্টারে ছড়িয়ে পড়ে। এই অবকাঠামো, প্রায় $ 1.6 বিলিয়ন ডলারের অপারেশনাল ব্যয় $ 944 মিলিয়ন ডলার সহ, $ 6 মিলিয়ন প্রশিক্ষণ ব্যয়ের দাবির সাথে উল্লেখযোগ্যভাবে বিরোধিতা করে।
%আইএমজিপি%চিত্র: ensigame.com
চীনা হেজ তহবিল হাই-ফ্লায়ারের সহায়ক সংস্থা ডিপসেক তার ডেটা সেন্টারের মালিক, নিয়ন্ত্রণ এবং দ্রুত উদ্ভাবন সরবরাহ করে। এর স্ব-অর্থায়িত স্থিতি তত্পরতা বাড়ায়। উচ্চ বেতন, কিছু গবেষকের জন্য বার্ষিক $ 1.3 মিলিয়ন ছাড়িয়ে শীর্ষস্থানীয় চীনা প্রতিভা আকর্ষণ করে।
%আইএমজিপি%চিত্র: ensigame.com
Million মিলিয়ন ডলার চিত্রটি কেবল প্রাক-প্রশিক্ষণ জিপিইউ ব্যয় উপস্থাপন করে, গবেষণা, পরিমার্জন, ডেটা প্রসেসিং এবং অবকাঠামো বাদ দেয়। ডিপসেকের মোট এআই বিনিয়োগ $ 500 মিলিয়ন ছাড়িয়েছে। যদিও এর পাতলা কাঠামো দক্ষতা বাড়িয়ে তোলে, "বিপ্লবী বাজেট" আখ্যানটি বিভ্রান্তিকর। সত্যিকারের ব্যয়টি উল্লেখযোগ্যভাবে বেশি, যদিও প্রতিযোগীদের তুলনায় এখনও সম্ভাব্য কম। উদাহরণস্বরূপ, ডিপসিকের আর 1 মডেলের দাম 5 মিলিয়ন ডলার, CHATGPT4O এর 100 মিলিয়ন ডলার তুলনায়। ডিপসিকের সাফল্য যথেষ্ট বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি দক্ষ দল থেকে উদ্ভূত, কেবলমাত্র একটি স্বল্প বাজেট নয়। তবুও, এর ব্যয়টি তার প্রতিযোগীদের তুলনায় উল্লেখযোগ্যভাবে কম রয়েছে।