DeepSeek представила новую модель V4, которая пришла на смену V3. Разработчики заявляют об улучшении эрудированности, логического мышления и агентных возможностей. Компания открыла доступ к двум версиям: V4-Pro и V4-Flash. Обе поддерживают контекстное окно до 1 млн токенов — это кратное увеличение по сравнению с 128 тыс. у предшественника.
Флагманская V4-Pro насчитывает 1,6 трлн параметров, из которых 49 млрд активируются на каждый токен, тогда как облегчённая V4-Flash содержит 284 млрд параметров с 13 млрд активных. Обе модели построены на архитектуре Mixture-of-Experts. При этом новый гибридный механизм внимания — комбинация Compressed Sparse Attention и Heavily Compressed Attention — позволяет V4-Pro использовать 27% вычислительных ресурсов и лишь 10% кэш-памяти по сравнению с предыдущей версией DeepSeek-V3.2.
Во внутренних тестах DeepSeek версия V4-Pro-Max показывает результаты, сопоставимые с ведущими моделями рынка. В ряде бенчмарков она превосходит GPT-5.2 и Gemini 3.0-Pro, хотя немного уступает более новым версиям — GPT-5.4 и Gemini 3.1-Pro. В задачах, связанных с агентным поведением, модель также демонстрирует уровень, близкий к Claude Opus 4.5.
Использование V4-Pro обходится дешевле аналогичных решений от OpenAI и Google, что может стать ключевым фактором для массового внедрения технологии, особенно на развивающихся рынках. Согласно опубликованным тарифам, V4-Flash предлагается по цене $0,14 за миллион входных токенов и $0,28 за миллион выходных токенов, а более мощный V4-Pro — $1,74 и $3,48 соответственно. Это в три раза дешевле GPT-5.5 по входным токенам и почти в девять раз по выходным.
Аналитики сходятся во мнении, что на фоне американских конкурентов V4 выглядит вполне конкурентоспособно, особенно с учётом цены, и способна занять заметное место на рынке. При этом другие эксперты называют модель скорее эволюционным шагом, а не прорывом уровня R1, который в своё время стал неожиданностью для всей отрасли. Ключевым отличием DeepSeek остаётся ставка на открытый исходный код. Компания предоставляет разработчикам доступ к архитектуре модели и возможность её модификации, что принципиально отличает её от конкурентов с закрытыми решениями.
Запуск V4 происходит на фоне усиливающегося технологического противостояния между США и Китаем. Американские компании, включая OpenAI и Anthropic, ранее обвиняли DeepSeek в использовании их технологий для обучения собственных моделей, однако китайская сторона отрицает это.

