После того как их модель R1 привлекла внимание в Кремниевой долине и на Уолл-стрит, стартап из Ханчжоу, основанный Лян Вэньфэном и выросший из хедж-фонда, продолжает придерживаться стратегии минимальной публичности. Компания взаимодействует в основном с сообществом разработчиков. 40-летний основатель избегает публичных комментариев и не дает интервью СМИ уже более месяца. Единственным недавним публичным появлением Ляна стало соавторство научной статьи, написанной совместно с 14 другими исследователями. Примечательно, что 12 из 15 авторов также участвовали в разработке R1, что подтверждает активное вовлечение руководителя в исследования DeepSeek.
Согласно анонимному источнику, близкому к DeepSeek, компания не планирует привлекать дополнительные инвестиции или расширять коммерческую деятельность. Вместо этого Лян Вэньфэн сосредоточен на развитии общего искусственного интеллекта, стремясь повысить эффективность моделей при минимальных затратах ресурсов. По словам источника, «время покажет, насколько это стратегически верное решение и как долго компания сможет поддерживать исследования в таком режиме». Он также подчеркнул, что «существующий закон масштабирования создает серьезные трудности для удержания лидерства только за счет совершенствования алгоритмов».
Несмотря на статус одной из самых известных и уважаемых компаний Китая, DeepSeek позиционирует себя как малоизвестный стартап, ограничивая доступ для посетителей и потенциальных инвесторов. При этом, по данным SemiAnalysis, она инвестировала в свои разработки более $500 млн.
Фирма не разглашает информацию о команде, структуре и графике исследований. Reuters сообщило, что компания ускоряет выпуск R2, преемника R1. В результате запуск R2, запланированный на май, переносится на более ранний срок. DeepSeek выпускала модели V2 и V3 с разницей в семь месяцев (в мае и декабре), а R1, основанная на V3, была выпущена в январе.
Команда Ляна продолжает делиться своими исследованиями с сообществом разработчиков. На этой неделе компания опубликовала три репозитория с открытым исходным кодом, раскрывающие технические детали инфраструктуры ИИ DeepSeek.
Эти материалы показывают, как компания создает недорогие, но высокопроизводительные модели. Сторонние разработчики высоко оценили этот шаг. Небольшая группа исследователей DeepSeek также участвовала в закрытом заседании на Глобальной конференции разработчиков в Шанхае.
В предыдущих интервью Лян Вэньфэн заявил, что цель DeepSeek — достижение AGI. На вопрос о сроках достижения общего ИИ он ответил, что «это может занять два, пять или даже десять лет, но это будет достигнуто при нашей жизни».