Проект относительно небольшой по объему: в скрипте, опубликованном на GitHub под лицензией MIT, всего 630 строк кода. Однако он реализует очень масштабную идею. По словам Карпатого, система позволяет ИИ-агентам непрерывно проводить исследования и улучшать алгоритмы, даже когда разработчики не участвуют в процессе.
Система работает как автономный цикл оптимизации. Агент получает исходный код модели и ограниченный вычислительный бюджет, например, несколько минут работы на графическом процессоре. Затем он формулирует гипотезу для улучшения, изменяет код, запускает эксперимент и оценивает результат.
Если показатели модели улучшаются, например, снижается число ошибок на валидационном датасете, изменение сохраняется. В противном случае оно откатывается, и агент пробует другую гипотезу. За одну ночь такой агент провёл 126 экспериментов и смог заметно улучшить результаты модели. После двух дней работы система выполнила около 700 автономных тестов. В результате ей удалось реализовать 20 дополнительных улучшений, которые особенно хорошо работают на крупных моделях.
В результате эффективность обучения выросла на 11%. При этом агент обнаружил проблемы в настройке механизмов внимания и регуляризации — ошибки, которые сам Карпатый не замечал во время ручной оптимизации.
Публикация проекта быстро привлекла внимание ИИ-сообщества. Глава платформы Hyperspace AI Варун Матур распределил систему по одноранговой сети, и 35 автономных агентов за ночь провели 333 эксперимента. В результате были заново открыты методы машинного обучения, на формализацию которых у исследователей из лабораторий вроде Google Brain и OpenAI ушло восемь лет. Разные типы оборудования, например, мощные GPU и обычные CPU на ноутбуках, заставляли агентов искать разные подходы, от грубой переборки параметров до более изобретательных стратегий инициализации и нормализации. Через протокол GossipSub успешные решения быстро распространялись по сети.
Основатель агентства Single Grain Эрик Сиу адаптировал автоматические исследовательские циклы ИИ для маркетинга. Агенты провели более 36 000 экспериментов с рекламными материалами — лэндингами, креативами и письмами — и автоматически оценили их эффективность. В результате система сформировала «карту» откликов аудитории. Для сравнения, традиционные маркетинговые команды обычно проводят лишь несколько десятков подобных тестов в год.
Эти инструменты способны трансформировать исследования в самых разных областях. Когда ИИ-агенты смогут самостоятельно выполнять тысячи экспериментов, функции исследователя будут смещаться от непосредственных итераций к проектированию исследовательских процессов. Как отмечает издание Venture Beat, код уже не просто пишется — создаются экосистемы, которые учатся самостоятельно, пока человек спит.

