Hitech logo

Кейсы

xAI запускает бета-версию Grok 4.2 с «командой» агентов

TODO:
Екатерина ШемякинскаяСегодня, 08:50 AM

Илон Маск представил публичную бету Grok 4.20 — первую версию чат-бота xAI, построенную на мультиагентной архитектуре. Вместо одной модели система работает как команда из четырех специализированных агентов (капитан, аналитик, логик и креативщик), которые «спорят» друг с другом и обмениваются промежуточными результатами перед выдачей ответа. По заявлению компании, такой подход снизил уровень галлюцинаций на 65% и позволил модели показать результаты выше конкурентов в тестах.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Внутри системы у каждого агента своя роль. Grok выступает «капитаном»: он разбивает запрос на подзадачи, распределяет работу и собирает ответы. Harper отвечает за поиск информации и сбор источников в интернете, Benjamin проверяет вычисления и строгую логику, а Lucas предлагает нестандартные подходы и креативные решения.

После запроса пользователя все четыре агента работают параллельно и обмениваются промежуточными результатами. Пользователи могут наблюдать этот процесс в новом интерфейсе: отображаются ход выполнения и заметки каждого агента в реальном времени. Обычным пользователям доступны до четырёх агентов на один запрос, а активным — до 16.

По данным xAI, Grok 4.20 показывает сильные результаты в тестах. В рейтинг Arena ELO модель достигла результатов в диапазоне 1505–1535, что ставит ее рядом с Gemini 3 Pro и выше Claude Opus 4.5 и GPT-5. На платформе ForecastBench система заняла второе место среди всех моделей, а в симуляции торговли акциями Alpha Arena показала доходность +34,59%, когда конкуренты ушли в минус.

xAI также утверждает, что мультиагентная архитектура заметно снижает число ошибок. Количество «галлюцинаций» якобы сократилось примерно с 12% до 4,2%. Компания объясняет это встроенной «взаимной проверкой»: один агент собирает данные, другой проверяет расчеты, а капитан сверяет выводы перед ответом.

Релиз Grok 4.20 совпал по времени с выходом Claude Sonnet 4.6 от Anthropic — традиционной мономодели с контекстным окном в 1 млн токенов. Если конкуренты делают ставку на расширение возможностей одной модели, xAI выбрала иной путь: систему из нескольких взаимодействующих агентов. Однако такой подход несет и риски: многоагентная архитектура может увеличивать задержки и вычислительные затраты, а также порождать новые типы ошибок. Один из таких сценариев — конфликт между агентами, когда капитану приходится выступать арбитром и выбирать, какое решение принять.

Маск призвал пользователей активно оставлять критическую обратную связь и отметил, что улучшения будут выходить с регулярными заметками к релизам. Бета Grok 4.20 уже доступна на сайте и в iOS/Android для подписчиков SuperGrok ($30 в месяц) и X Premium+, а более широкий доступ и API ожидаются позже.