Аналитиците на SemiAnalysis разбиха мита за евтиния изкуствен интелект, като разкриха реалния мащаб на DeepSeek
Китайският стартъп DeepSeek привлече вниманието на всички с твърдението, че е създал конкурентен ИИ модел на минимална цена. Компанията твърди, че е похарчила само 6 млн. долара и е използвала 2 048 графични процесора (GPU) за обучението на мощната невронна мрежа DeepSeek V3. Новият отчет на SemiAnalysis обаче показва, че компанията разполага с 50 000 графични процесора Nvidia и е похарчила поне 1,6 млрд. долара за изграждане на инфраструктурата.
Според експертите DeepSeek управлява голяма изчислителна инфраструктура от около 50 000 графични процесора Hopper. Те включват 10 000 броя H800 и 10 000 броя от по-мощните H100, както и допълнителни партиди H20. Тези ресурси са разпределени в множество центрове за данни и се използват за обучение на ИИ, научни изследвания и финансово моделиране. Както съобщава Tom’s Hardware, общите капиталови разходи за сървърите са около 1,6 млрд. долара, а оперативните разходи се оценяват на 944 млн. долара.

Да напомним, че DeepSeek възникна като дъщерен проект на китайския хедж фонд High-Flyer, който от 2023 г. обособи стартъпа в отделен бизнес, фокусиран върху ИИ технологиите. За разлика от повечето стартъпи, които наемат капацитет от доставчици на облачни услуги, компанията разполага със собствени центрове за данни, което ѝ дава пълен контрол по отношение на оптимизирането на моделите на ИИ и позволява по-бързи иновации. Освен това, тъй като DeepSeek остава изцяло самофинансираща се организация, всички решения се вземат по-бързо и гъвкаво, което прави компанията по-ефективна от традиционните участници на пазара.
Политиката в областта на човешките ресурси заслужава специално внимание. Компанията наема специалисти единствено от Китай, като набляга на уменията и способността за решаване на сложни проблеми, а не на официалните дипломи. В същото време заплатите на някои изследователи в DeepSeek надхвърлят 1,3 млн. долара годишно, което позволява на компанията да привлича таланти от водещите университети в страната.
Въпреки че DeepSeek се позиционира като новатор, способен да предизвика лидерите в индустрията, анализаторите на SemiAnalysis подчертават, че успехът на компанията се основава на многомилиардни инвестиции, технически пробиви и силен екип, а твърденията за „революционен бюджет“, изразходван за модела на ИИ, може да са преувеличени.
Но въпреки тези нападки, няма как да забравим, че ИИ DeepSeek е безплатен и с отворен код, като сорс кодът и базите данни могат да бъдат изтеглено от всеки, например от GitHub. Мнозина вече инсталираха този изкуствен интелект и на практика всички са учудени от неговата великолепна работа на локални компютри – без връзка с интернет и каквито и да било електронни облаци. Това е наистина важно достижение.









