Внутри системы у каждого агента своя роль. Grok выступает «капитаном»: он разбивает запрос на подзадачи, распределяет работу и собирает ответы. Harper отвечает за поиск информации и сбор источников в интернете, Benjamin проверяет вычисления и строгую логику, а Lucas предлагает нестандартные подходы и креативные решения.
После запроса пользователя все четыре агента работают параллельно и обмениваются промежуточными результатами. Пользователи могут наблюдать этот процесс в новом интерфейсе: отображаются ход выполнения и заметки каждого агента в реальном времени. Обычным пользователям доступны до четырёх агентов на один запрос, а активным — до 16.
По данным xAI, Grok 4.20 показывает сильные результаты в тестах. В рейтинг Arena ELO модель достигла результатов в диапазоне 1505–1535, что ставит ее рядом с Gemini 3 Pro и выше Claude Opus 4.5 и GPT-5. На платформе ForecastBench система заняла второе место среди всех моделей, а в симуляции торговли акциями Alpha Arena показала доходность +34,59%, когда конкуренты ушли в минус.
xAI также утверждает, что мультиагентная архитектура заметно снижает число ошибок. Количество «галлюцинаций» якобы сократилось примерно с 12% до 4,2%. Компания объясняет это встроенной «взаимной проверкой»: один агент собирает данные, другой проверяет расчеты, а капитан сверяет выводы перед ответом.
Релиз Grok 4.20 совпал по времени с выходом Claude Sonnet 4.6 от Anthropic — традиционной мономодели с контекстным окном в 1 млн токенов. Если конкуренты делают ставку на расширение возможностей одной модели, xAI выбрала иной путь: систему из нескольких взаимодействующих агентов. Однако такой подход несет и риски: многоагентная архитектура может увеличивать задержки и вычислительные затраты, а также порождать новые типы ошибок. Один из таких сценариев — конфликт между агентами, когда капитану приходится выступать арбитром и выбирать, какое решение принять.
Маск призвал пользователей активно оставлять критическую обратную связь и отметил, что улучшения будут выходить с регулярными заметками к релизам. Бета Grok 4.20 уже доступна на сайте и в iOS/Android для подписчиков SuperGrok ($30 в месяц) и X Premium+, а более широкий доступ и API ожидаются позже.

