Отвъд мита DeepSeek: Компанията е похарчила 1.6 млрд. долара за техника

Tech

05.02.2025

Китайският стартъп DeepSeek наскоро зае централно място в технологичния свят със стряскащо ниското си използване на изчислителни ресурси за своя усъвършенстван ИИ модел, наречен R1, модел, за който се смята, че е конкурентен на o1 на Open AI въпреки твърденията на компанията, че DeepSeek струва само 6 милиона долара и ползва 2048 GPU за обучение. Фирмата за индустриални анализи SemiAnalysis обаче съобщава, че компанията зад DeepSeek е направила хардуерни разходи в размер на 1.6 милиарда долара и има база от 50 000 графични процесора Nvidia Hopper: откритие, което подкопава идеята, че DeepSeek е преоткрил обучението и изводите за ИИ с драматично по-ниски инвестиции от лидерите на индустрията.

DeepSeek управлява обширна изчислителна инфраструктура с приблизително 50 000 графични процесора Hopper, твърди докладът. Това включва 10 000 H800s и 10 000 H100s, с допълнителни покупки на H20 единици според SemiAnalysis. Тези ресурси са разпределени на множество места и служат за цели като обучение на ИИ, изследвания и финансово моделиране. Общата капиталова инвестиция на компанията в сървъри е около 1.6 милиарда долара, като приблизително 944 милиона долара са изразходвани за оперативни разходи според данни на SemiAnalysis.

DeepSeek привлече вниманието на пазара на изкуствен интелект, когато разкри незначителните хардуерни изисквания на своя ИИ модел DeepSeek-V3 Mixture-of-Experts (MoE), които бяха обявени като значително по-ниски в сравнение с тези на базираните в САЩ модели. След това DeepSeek предложи и конкурентния R1 AI модел. Въпреки това уважаваната компания за пазарно разузнаване SemiAnalysis разкри констатациите си, които показват, че компанията има хардуерни инвестиции на стойност около 1.6 милиарда долара.

DeepSeek произхожда от High-Flyer - китайски хедж фонд, който възприе ИИ рано и инвестира сериозно в графични процесори. През 2023 г. High-Flyer стартира DeepSeek като отделно начинание, фокусирано единствено върху ИИ. За разлика от много конкуренти DeepSeek остава самофинансиран, което му дава гъвкавост и бързина при вземането на решения. Въпреки твърденията, че това е малко начинание, компанията е инвестирала над 500 милиона долара в своята технология според SemiAnalysis.

Основна отличителна черта на DeepSeek е способността ѝ да управлява свои собствени центрове за данни, за разлика от повечето други стартиращи ИИ компании, които разчитат на външни доставчици на облачни услуги. Тази независимост позволява пълен контрол върху експериментите и оптимизациите на ИИ модела. В допълнение това спомага за бързо надграждане без външни затруднения, което прави DeepSeek много ефективна в сравнение с традиционните играчи в индустрията.

Има и още нещо, което човек не би очаквал от китайска компания: придобиване на таланти от Китай, без привличане на човешки ресурси от Тайван или САЩ. DeepSeek наема изключително от Китай, като се фокусира върху уменията и способностите за решаване на проблеми, а не върху официалните пълномощия според SemiAnalysis. Усилията за набиране на персонал са насочени към институции като Пекинския университет и Zhejiang University, предлагащи изключително конкурентни заплати. Според изследването някои изследователи в DeepSeek печелят над 1.3 милиона долара, надхвърляйки възнаграждението в други водещи китайски фирми за ИИ като Moonshot.

Поради притока на кадри DeepSeek е пионер в иновации като Multi-Head Latent Attention (MLA), което изисква месеци на разработка и значително използване на GPU, съобщава SemiAnalysis. DeepSeek набляга на ефективността и алгоритмичните подобрения спрямо мащабирането с груба сила, променяйки очакванията около разработването на ИИ модели. Този подход по много причини накара някои да вярват, че бързият напредък може да намали търсенето на графични процесори от висок клас, което оказва влияние върху компании като Nvidia.

Неотдавнашно твърдение, че DeepSeek е обучил най-новия си модел само за 6 милиона долара, подхрани голяма част от шума около компанията. Въпреки това тази цифра се отнася само за част от общите разходи за обучение - по-конкретно GPU времето, необходимо за предварително обучение. Той не отчита разходите за изследвания, усъвършенстване на модела, обработка на данни или общи инфраструктурни разходи. В действителност DeepSeek е похарчил над 500 милиона долара за разработване на ИИ от създаването си. За разлика от по-големите фирми, обременени от бюрокрация, стройната структура на DeepSeek ѝ позволява да напредва агресивно в иновациите на ИИ, смята SemiAnalysis.

Възходът на DeepSeek подчертава как една добре финансирана, независима ИИ компания може да предизвика лидерите в индустрията. Публичният дискурс обаче може да е бил воден от имидж и слухове, докато реалността е по-сложна: SemiAnalysis твърди, че успехът на DeepSeek се основава на стратегически инвестиции от милиарди долари, технически пробиви и конкурентна работна сила. Това означава, че няма чудеса. Както Илон Мъск отбеляза преди година, ако искате да сте конкурентоспособни в ИИ, трябва да харчите милиарди годишно, което според съобщенията е в диапазона на изразходваното.

Снимка: Unsplash

Виж още: Изграждайте здравословни навици и можете да спечелите фантастични награди от HUAWEI

Тагове: