ИИ-агенты обучают роботов без участия человека с результативностью 99%

Кейсы

Екатерина ШемякинскаяСегодня, 02:15 PM

Екатерина ШемякинскаяСегодня, 02:15 PM

Исследователи из лаборатории Nvidia GEAR совместно с университетами разработали платформу ENPIRE, которая дает ИИ-агентам возможность автономно обучать роботов сложным физическим задачам без участия человека. В тестах на агентах OpenAI, Anthropic и Moonshot AI система достигла 99% успешности в разных задачах — от перемещения блока до установки графического процессора в материнскую плату. Nvidia откроет исходный код ENPIRE, чтобы любой желающий мог развернуть свою автономную лабораторию роботов.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

ENPIRE состоит из четырёх модулей. Первый отвечает за автоматический сброс и проверку задач, второй уточняет правила поведения роботов, третий оценивает эти правила на нескольких физических роботах, работающих параллельно, а четвёртый устраняет сбои — анализирует журналы ошибок, обрабатывает научные статьи и улучшает алгоритмический код. Вместе эти модули образуют замкнутый цикл самосовершенствования, который не требует вмешательства человека.

Однократная инъекция генной терапии продлила жизнь мышей на 20%

Систему протестировали на трех ИИ-агентах: Codex от OpenAI на базе GPT-5.5, Claude Code от Anthropic на базе Opus 4.7 и Kimi Code от Moonshot AI на базе Kimi K2.6. Каждая команда агентов независимо разрабатывала алгоритмы обучения роботов, проверяла их в реальных экспериментах и сохраняла только те изменения, которые улучшали результат. «Часть нашей лаборатории теперь неустанно самосовершенствуется по ночам, а мы просто читаем отчёты по утрам», — написал директор по ИИ в Nvidia Джим Фан.

В результате ИИ-агенты достигли 99-процентной успешности в нескольких задачах манипулирования: перемещении Т-образного блока в заданное положение, упорядочивании булавок в коробке, завязывании и разрезании пластиковых стяжек, а также установке графического процессора в разъём материнской платы с последующим извлечением для перезагрузки перед следующим испытанием. В задаче с булавками агенты достигли почти стопроцентного успеха быстрее, чем лучший метод, разработанный людьми-исследователями.

Эксперименты также показали, что размер команды агентов напрямую влияет на скорость обучения. Группа из восьми агентов справилась с задачей перемещения блока за два часа, команда из четырёх агентов — за три часа, а одиночный агент потратил почти пять часов. Параллельная работа нескольких агентов позволяет быстрее исследовать различные подходы и отбирать лучшие.

Исследователи зафиксировали и ограничения. Роботы нередко простаивали, пока агенты были заняты чтением логов, написанием кода или ожиданием ответа языковой модели. Большие команды агентов тратили непропорционально много времени на обобщение идей друг друга вместо того, чтобы активнее задействовать роботов. Кроме того, агенты не всегда эффективно использовали доступные вычислительные ресурсы при запуске параллельных сессий обучения.

Отдельный фактор — стоимость. Чем больше агентов задействовано в работе, тем больше токенов они требуют. Это особенно актуально на фоне того, что разработчики ИИ, в том числе Anthropic, рассматривают изменения в ценообразовании, которые увеличат стоимость использования подобных систем.

Тем не менее, команда намерена открыть исходный код ENPIRE для всех желающих.

Новая разработка вписывается в стратегию Nvidia в области физического ИИ. В конце мая компания объявила о партнёрстве с китайской робототехнической компанией Unitree для создания эталонного человекоподобного робота для исследовательских лабораторий. А в начале июня генеральный директор Nvidia Дженсен Хуанг встретился с руководством Hyundai Motor, материнской компании Boston Dynamics, для обсуждения массового производства роботов с искусственным интеллектом.

Также по теме

Кейсы

MiniMax выпустила «ИИ-программиста» M2.1. Он в 10 раз дешевле Claude

Кейсы

TSMC ускорит передачу технологий производства чипов в США

Кейсы

Портативная система получения воды из воздуха помещается в сумке

Кейсы

NASA доверило частным компаниям связь в радиусе 2 млн км от Земли

Новости СМИ2