ENPIRE состоит из четырёх модулей. Первый отвечает за автоматический сброс и проверку задач, второй уточняет правила поведения роботов, третий оценивает эти правила на нескольких физических роботах, работающих параллельно, а четвёртый устраняет сбои — анализирует журналы ошибок, обрабатывает научные статьи и улучшает алгоритмический код. Вместе эти модули образуют замкнутый цикл самосовершенствования, который не требует вмешательства человека.
Систему протестировали на трех ИИ-агентах: Codex от OpenAI на базе GPT-5.5, Claude Code от Anthropic на базе Opus 4.7 и Kimi Code от Moonshot AI на базе Kimi K2.6. Каждая команда агентов независимо разрабатывала алгоритмы обучения роботов, проверяла их в реальных экспериментах и сохраняла только те изменения, которые улучшали результат. «Часть нашей лаборатории теперь неустанно самосовершенствуется по ночам, а мы просто читаем отчёты по утрам», — написал директор по ИИ в Nvidia Джим Фан.
В результате ИИ-агенты достигли 99-процентной успешности в нескольких задачах манипулирования: перемещении Т-образного блока в заданное положение, упорядочивании булавок в коробке, завязывании и разрезании пластиковых стяжек, а также установке графического процессора в разъём материнской платы с последующим извлечением для перезагрузки перед следующим испытанием. В задаче с булавками агенты достигли почти стопроцентного успеха быстрее, чем лучший метод, разработанный людьми-исследователями.
Эксперименты также показали, что размер команды агентов напрямую влияет на скорость обучения. Группа из восьми агентов справилась с задачей перемещения блока за два часа, команда из четырёх агентов — за три часа, а одиночный агент потратил почти пять часов. Параллельная работа нескольких агентов позволяет быстрее исследовать различные подходы и отбирать лучшие.
Исследователи зафиксировали и ограничения. Роботы нередко простаивали, пока агенты были заняты чтением логов, написанием кода или ожиданием ответа языковой модели. Большие команды агентов тратили непропорционально много времени на обобщение идей друг друга вместо того, чтобы активнее задействовать роботов. Кроме того, агенты не всегда эффективно использовали доступные вычислительные ресурсы при запуске параллельных сессий обучения.
Отдельный фактор — стоимость. Чем больше агентов задействовано в работе, тем больше токенов они требуют. Это особенно актуально на фоне того, что разработчики ИИ, в том числе Anthropic, рассматривают изменения в ценообразовании, которые увеличат стоимость использования подобных систем.
Тем не менее, команда намерена открыть исходный код ENPIRE для всех желающих.
Новая разработка вписывается в стратегию Nvidia в области физического ИИ. В конце мая компания объявила о партнёрстве с китайской робототехнической компанией Unitree для создания эталонного человекоподобного робота для исследовательских лабораторий. А в начале июня генеральный директор Nvidia Дженсен Хуанг встретился с руководством Hyundai Motor, материнской компании Boston Dynamics, для обсуждения массового производства роботов с искусственным интеллектом.

