DeepSeekMath-V2 демонстрирует способность не только находить правильные ответы, но и предоставлять логически обоснованные и проверяемые доказательства. Модель решила Международную математическую олимпиаду 2025 года (IMO) и Китайскую математическую олимпиаду 2024 года (CMO), показав результаты, соответствующие «золотой медали» — стандарту, которого достигают лишь около 8% участников-людей. На конкурсе Putnam Exam 2024 года модель набрала 118 из 120 баллов, превзойдя наивысший результат человека в 90 баллов.
Главной особенностью DeepSeekMath-V2 стала система самопроверки рассуждений: одна часть модели создает математические доказательства, а другая выступает рецензентом, который проверяет их корректность. Такой механизм гарантирует правильность не только финального ответа, но и всего процесса логического вывода.
По словам команды DeepSeek, эта технология устраняет ограничение традиционных математических ИИ-моделей, которые демонстрируют высокие результаты на стандартных тестах, но не всегда обеспечивают надежность рассуждений при решении новых задач. Самопроверяемые рассуждения открывают путь к созданию более мощных и надежных систем ИИ для научных исследований.
DeepSeek также подчеркнула образовательное и исследовательское значение модели. Публикация исходного кода снижает барьеры для разработчиков и ученых. Они смогут экспериментировать с передовыми математическими ИИ-системами, традиционно ограниченными проприетарными платформами.
Эксперты, включая Хуана Ичена из Гарварда и Яна Линя из Калифорнийского университета в Лос-Анджелесе, отметили, что Международная математическая олимпиада, которая проводится ежегодно с 1959 года, — одно из самых престижных соревнований, проверяющих способность к глубокому и креативному мышлению. Успех DeepSeekMath-V2 на IMO подчеркивает уровень зрелости модели и её потенциал для расширения границ математического ИИ.

