DeepSeek выпустила открытые модели V4 с контекстным окном в 1 млн токенов

Кейсы

Екатерина Шемякинская24 апреля, 10:50

Екатерина Шемякинская24 апреля, 10:50

Китайский стартап DeepSeek представил предварительные версии модели искусственного интеллекта V4 — крупнейшее обновление со времён R1. Новинка предлагает контекстное окно в 1 млн токенов (против 128 тыс. у V3), а флагманская версия V4-Pro насчитывает 1,6 трлн параметров. Согласно внутренним тестам, модель сопоставима с лидерами рынка, включая GPT-5.4 и Gemini 3.1-Pro, при этом ее использование обходится в разы дешевле.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

DeepSeek представила новую модель V4, которая пришла на смену V3. Разработчики заявляют об улучшении эрудированности, логического мышления и агентных возможностей. Компания открыла доступ к двум версиям: V4-Pro и V4-Flash. Обе поддерживают контекстное окно до 1 млн токенов — это кратное увеличение по сравнению с 128 тыс. у предшественника.

Ученые создали квантовую вселенную, в которой время возникло само по себе

Флагманская V4-Pro насчитывает 1,6 трлн параметров, из которых 49 млрд активируются на каждый токен, тогда как облегчённая V4-Flash содержит 284 млрд параметров с 13 млрд активных. Обе модели построены на архитектуре Mixture-of-Experts. При этом новый гибридный механизм внимания — комбинация Compressed Sparse Attention и Heavily Compressed Attention — позволяет V4-Pro использовать 27% вычислительных ресурсов и лишь 10% кэш-памяти по сравнению с предыдущей версией DeepSeek-V3.2.

Во внутренних тестах DeepSeek версия V4-Pro-Max показывает результаты, сопоставимые с ведущими моделями рынка. В ряде бенчмарков она превосходит GPT-5.2 и Gemini 3.0-Pro, хотя немного уступает более новым версиям — GPT-5.4 и Gemini 3.1-Pro. В задачах, связанных с агентным поведением, модель также демонстрирует уровень, близкий к Claude Opus 4.5.

Использование V4-Pro обходится дешевле аналогичных решений от OpenAI и Google, что может стать ключевым фактором для массового внедрения технологии, особенно на развивающихся рынках. Согласно опубликованным тарифам, V4-Flash предлагается по цене $0,14 за миллион входных токенов и $0,28 за миллион выходных токенов, а более мощный V4-Pro — $1,74 и $3,48 соответственно. Это в три раза дешевле GPT-5.5 по входным токенам и почти в девять раз по выходным.

Аналитики сходятся во мнении, что на фоне американских конкурентов V4 выглядит вполне конкурентоспособно, особенно с учётом цены, и способна занять заметное место на рынке. При этом другие эксперты называют модель скорее эволюционным шагом, а не прорывом уровня R1, который в своё время стал неожиданностью для всей отрасли. Ключевым отличием DeepSeek остаётся ставка на открытый исходный код. Компания предоставляет разработчикам доступ к архитектуре модели и возможность её модификации, что принципиально отличает её от конкурентов с закрытыми решениями.

Запуск V4 происходит на фоне усиливающегося технологического противостояния между США и Китаем. Американские компании, включая OpenAI и Anthropic, ранее обвиняли DeepSeek в использовании их технологий для обучения собственных моделей, однако китайская сторона отрицает это.

Также по теме

Кейсы

Центр Чумакова установил эффективность препарата «Лизобакт Комплит®» для борьбы с коронавирусом

Кейсы

Стартап передал данные лазером на 65 км со скоростью 100 Гбит/с

Кейсы

Tesla намерена построить свой следующий завод в Индии

Кейсы

SpaceX заявила, что 5G сделает невозможной работу Starlink в США

Новости СМИ2