Hitech logo

Кейсы

Google анонсировала Gemini 3.1 Pro — модель лучше справляется со сложными задачами

TODO:
Екатерина ШемякинскаяСегодня, 09:03 AM

Google представила обновлённую версию своей флагманской модели искусственного интеллекта — Gemini 3.1 Pro. Новинка уже доступна в режиме предварительного просмотра для разработчиков и пользователей. Компания обещает заметные улучшения в логическом мышлении, решении сложных задач и построении более точных и детализированных ответов. В тесте Humanity’s Last Exam модель обошла GPT-5.2 от OpenAI.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Обновление стало логичным продолжением ноябрьского релиза Gemini 3. По данным Google, именно версия 3.1 Pro лежит в основе недавнего апдейта инструмента Deep Think, где была улучшена «базовая интеллектуальная архитектура». Новая модель ориентирована как на массовых пользователей, так и на разработчиков, создающих агентные ИИ-сценарии.

В тесте Humanity’s Last Exam, который проверяет продвинутые специализированные знания, Gemini 3.1 Pro набрала 44,4% — это лучший результат среди представленных моделей Google. Для сравнения, предыдущая версия Gemini 3 Pro получила 37,5%, а GPT-5.2 от OpenAI — 34,5%.

Особенно заметный прогресс продемонстрирован в тесте ARC-AGI-2, где оцениваются способности решать новые логические задачи, не встречавшиеся в обучающих данных. Если Gemini 3 показывала лишь 31,1%, то версия 3.1 Pro достигла 77,1%, более чем вдвое улучшив показатель.

Тем не менее, в пользовательском рейтинге Arena (бывший LM Arena) новинка не стала лидером. В категории текста модель Claude Opus 4.6 опережает Gemini 3.1 Pro на несколько баллов, а в задачах по программированию впереди также остаются Opus 4.6, Opus 4.5 и GPT-5.2 High. Рейтинг формируется на основе пользовательских голосований, где оценивается субъективное качество ответов.

Для демонстрации возможностей Google показала примеры генерации графики и симуляций. В частности, улучшилось создание SVG-изображений — они выглядят более аккуратными и структурированными. Компания подчёркивает, что модель лучше справляется с комплексными абстрактными запросами и выдаёт более последовательные рассуждения.

Разработчики, использующие Gemini для создания агентных рабочих процессов, также могут рассчитывать на прирост производительности. В бенчмарке APEX-Agents версия 3.1 Pro почти удвоила результат по сравнению с предыдущей моделью.

Gemini 3.1 Pro уже доступна в AI Studio и Antigravity IDE в режиме preview, а корпоративные клиенты получат её через Vertex AI и Gemini Enterprise. Обычные пользователи могут протестировать модель в приложении Gemini и сервисе NotebookLM. Стоимость API и размер контекстного окна остались прежними: $2 за миллион входных токенов, $12 за миллион выходных, при лимите 1 млн входных и 64 тыс. выходных токенов.