Hitech logo

Кейсы

DeepSeek стремится к общему ИИ, а не к прибыли

TODO:
Екатерина Шемякинская2 марта, 11:03

Китайский стартап DeepSeek, получивший мировую известность благодаря своей «рассуждающей» модели R1, ставит научные исследования выше финансовой выгоды. Компания, основанная Лян Вэньфэном, придерживается стратегии минимальной публичности и избегает интервью со СМИ. DeepSeek сосредоточена на развитии общего искусственного интеллекта (AGI), открыто делится своими разработками и не спешит привлекать дополнительные инвестиции, несмотря на интерес со стороны инвесторов и статус одной из самых уважаемых компаний Китая.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

После того как их модель R1 привлекла внимание в Кремниевой долине и на Уолл-стрит, стартап из Ханчжоу, основанный Лян Вэньфэном и выросший из хедж-фонда, продолжает придерживаться стратегии минимальной публичности. Компания взаимодействует в основном с сообществом разработчиков. 40-летний основатель избегает публичных комментариев и не дает интервью СМИ уже более месяца. Единственным недавним публичным появлением Ляна стало соавторство научной статьи, написанной совместно с 14 другими исследователями. Примечательно, что 12 из 15 авторов также участвовали в разработке R1, что подтверждает активное вовлечение руководителя в исследования DeepSeek.

Согласно анонимному источнику, близкому к DeepSeek, компания не планирует привлекать дополнительные инвестиции или расширять коммерческую деятельность. Вместо этого Лян Вэньфэн сосредоточен на развитии общего искусственного интеллекта, стремясь повысить эффективность моделей при минимальных затратах ресурсов. По словам источника, «время покажет, насколько это стратегически верное решение и как долго компания сможет поддерживать исследования в таком режиме». Он также подчеркнул, что «существующий закон масштабирования создает серьезные трудности для удержания лидерства только за счет совершенствования алгоритмов».

Несмотря на статус одной из самых известных и уважаемых компаний Китая, DeepSeek позиционирует себя как малоизвестный стартап, ограничивая доступ для посетителей и потенциальных инвесторов. При этом, по данным SemiAnalysis, она инвестировала в свои разработки более $500 млн.

Фирма не разглашает информацию о команде, структуре и графике исследований. Reuters сообщило, что компания ускоряет выпуск R2, преемника R1. В результате запуск R2, запланированный на май, переносится на более ранний срок. DeepSeek выпускала модели V2 и V3 с разницей в семь месяцев (в мае и декабре), а R1, основанная на V3, была выпущена в январе.

Команда Ляна продолжает делиться своими исследованиями с сообществом разработчиков. На этой неделе компания опубликовала три репозитория с открытым исходным кодом, раскрывающие технические детали инфраструктуры ИИ DeepSeek.

Эти материалы показывают, как компания создает недорогие, но высокопроизводительные модели. Сторонние разработчики высоко оценили этот шаг. Небольшая группа исследователей DeepSeek также участвовала в закрытом заседании на Глобальной конференции разработчиков в Шанхае.

В предыдущих интервью Лян Вэньфэн заявил, что цель DeepSeek — достижение AGI. На вопрос о сроках достижения общего ИИ он ответил, что «это может занять два, пять или даже десять лет, но это будет достигнуто при нашей жизни».