Согласно отчету SemiAnalysis, DeepSeek располагает крупной вычислительной инфраструктурой, включающей около 50 000 графических процессоров Hopper, в том числе 10 000 H800 и 10 000 более мощных H100, а также другие устройства H20. Эти ресурсы распределены по нескольким площадкам и используются для таких целей, как обучение ИИ, исследования и финансовое моделирование. Общие капитальные вложения компании в серверы составляют $1,6 млрд, а операционные расходы оцениваются в $944 млн.
DeepSeek выросла из китайского хедж-фонда High-Flyer, который рано начал инвестировать в технологии искусственного интеллекта и активно закупал графические процессоры. В 2023 году High-Flyer выделил DeepSeek в отдельное предприятие, которое полностью сосредоточилось на разработке ИИ. В отличие от многих конкурентов, DeepSeek финансируется исключительно за счет собственных средств, что обеспечивает ей гибкость и оперативность в принятии решений.
Хотя DeepSeek позиционируется как небольшая компания, по данным SemiAnalysis, она инвестировала в свои разработки более $500 млн.
В отличие от большинства ИИ-стартапов, которые полагаются на внешних поставщиков облачных услуг, DeepSeek обладает собственными дата-центрами. Поэтому у нее есть полный контроль над экспериментами и оптимизацией моделей, что ускоряет процесс разработки. Кроме того, DeepSeek сосредоточена на привлечении талантов исключительно из материкового Китая, что нетипично для китайских стартапов в сфере ИИ. Компания делает ставку на практические навыки и умение решать задачи, а не на формальные дипломы, привлекая выпускников ведущих китайских университетов конкурентоспособными зарплатами. По некоторым данным, ИИ-исследователи в DeepSeek могут получать свыше $1,3 млн в год.
Благодаря привлечению талантливых специалистов DeepSeek разработала инновационные решения, такие как Multi-Head Latent Attention (MLA), на создание которой ушли месяцы работы и огромные вычислительные ресурсы GPU, сообщает SemiAnalysis. Компания делает ставку на повышение эффективности и оптимизацию алгоритмов, а не на увеличение вычислительных мощностей. Поэтому некоторые эксперты полагают, что дальнейшие успехи в этой области могут снизить спрос на топовые GPU, что ударит по компаниям вроде Nvidia.
Недавнее заявление о том, что DeepSeek обучила свою новейшую модель всего за $6 млн, вызвало большой ажиотаж. Однако эта сумма покрывает лишь часть общих затрат — исключительно расходы на GPU для предварительного обучения. Она не учитывает затраты на исследования, доработку модели, обработку данных или общую инфраструктуру. В реальности DeepSeek инвестировала в разработку ИИ более $500 млн с момента своего основания. В отличие от крупных компаний, скованных бюрократией, DeepSeek с ее гибкой структурой может активно развивать инновации в области ИИ, отмечает SemiAnalysis.
Успех DeepSeek основан на стратегических инвестициях в миллиарды долларов, технических прорывах и высококонкурентной команде. Так что чудес не бывает. Как отметил Илон Маск, чтобы быть конкурентоспособным в ИИ, необходимо тратить миллиарды долларов ежегодно, что, судя по всему, и делает DeepSeek.