Команда из 16 ИИ-агентов Claude за 2 недели создала новый компилятор языка C

Кейсы

Екатерина ШемякинскаяСегодня, 09:48 AM

Екатерина ШемякинскаяСегодня, 09:48 AM

Anthropic продемонстрировала амбициозный эксперимент по программированию с помощью ИИ. Группа из 16 агентов модели Claude Opus 4.6 создала компилятор C с нуля. В течение двух недель и почти 2 000 сессий агенты написали около 100 000 строк кода на Rust, способных собирать ядро Linux 6.9 на архитектурах x86, ARM и RISC-V. Стоимость работы составила примерно $20 000 в виде платы за API. Считается, что команда высококлассных программистов справилась бы с такой задачей года за два.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Компилятор — это программа, которая переводит код, написанный на языке программирования, в команды, понятные компьютеру, превращая инструкции программиста в работающую программу. Компилятор C особенно удобен для экспериментов с полуавтономными ИИ-моделями — его спецификация хорошо известна и проверена десятилетиями, доступны наборы тестов и эталонные реализации для проверки работы.

Масштабное исследование показало, что витамин D в три раза замедляет старение

Исследователь Anthropic Николас Карлини рассказал в блоге компании, как он запустил 16 экземпляров модели ИИ Claude Opus 4.6, поручив им совместно разработать компилятор C с нуля. Проект был реализован с использованием новой функции «команды агентов». Каждый экземпляр работал автономно в собственном контейнере Docker, клонируя общий репозиторий и решая задачи без центрального оркестратора. Агенты самостоятельно распределяли задачи, разрешали конфликты слияния и отправляли результаты обратно в репозиторий.

Полученный компилятор способен собирать крупные проекты с открытым исходным кодом, включая PostgreSQL, Redis, SQLite, FFmpeg и QEMU, а также прошёл 99% стресс-тестов GCC. Среди самых впечатляющих достижений — компиляция и запуск игры Doom.

Но есть и ограничения. Например, отсутствует 16-битный бэкенд для x86, необходимый для загрузки Linux в реальном режиме, а собственный ассемблер и компоновщик работают с ошибками. Код, сгенерированный на Rust, менее оптимален по сравнению с тем, что написал бы опытный программист. Новые функции и исправления ошибок часто нарушали работу. Эксперимент также показал практический предел автономного агентного кодирования — около 100 000 строк кода. После этого модели теряют согласованность и эффективность. По словам Карлини, это иллюстрирует ограничения современных ИИ-агентов при решении сложных, долгосрочных задач.

Реальная автономность проекта вызывает сомнения. Основная работа заключалась не в написании кода ИИ-агентами, а в создании сложнейшей инфраструктуры и «костылей» вокруг них. Разработчикам пришлось вручную проектировать конвейеры непрерывной интеграции и системы фильтрации контекста, чтобы модели не «забывали» задачу из-за обилия данных.

У Claude отсутствовало «чувство времени», из-за чего модель могла застревать на одних и тех же ошибках. Чтобы избежать этого, инженерам пришлось внедрять специальные механизмы контроля.

Заявленная стоимость в $20 000 отражает лишь «верхушку айсберга» — фактические затраты на токены API. За кадром остаются миллиардные инвестиции в обучение самой модели, интеллектуальный вклад исследователей и десятилетия труда поколений инженеров. Именно их работа по созданию эталонных компиляторов и наборов тестов заложила тот фундамент, без которого успех проекта был бы просто невозможен.

Тем не менее, достижение демонстрирует качественный скачок в возможностях ИИ. Еще год назад создание функционального компилятора даже под строгим надзором было невозможным. Сам Карлини выражает тревогу по поводу будущего индустрии. Его пугает перспектива массового развертывания программного обеспечения, которое программисты-люди никогда лично не проверяли и до конца не понимают.

Также по теме

Кейсы

Первый Startup Village Junior – как это было

Кейсы

Пентагону представлен первый проект экраноплана грузоподъемностью 100 тонн

Кейсы

Робопес обезвредил бомбу в ходе испытаний британской армии

Кейсы

Курьеры на велосипедах получат удобные маршруты

Новости СМИ2