Компилятор — это программа, которая переводит код, написанный на языке программирования, в команды, понятные компьютеру, превращая инструкции программиста в работающую программу. Компилятор C особенно удобен для экспериментов с полуавтономными ИИ-моделями — его спецификация хорошо известна и проверена десятилетиями, доступны наборы тестов и эталонные реализации для проверки работы.
Исследователь Anthropic Николас Карлини рассказал в блоге компании, как он запустил 16 экземпляров модели ИИ Claude Opus 4.6, поручив им совместно разработать компилятор C с нуля. Проект был реализован с использованием новой функции «команды агентов». Каждый экземпляр работал автономно в собственном контейнере Docker, клонируя общий репозиторий и решая задачи без центрального оркестратора. Агенты самостоятельно распределяли задачи, разрешали конфликты слияния и отправляли результаты обратно в репозиторий.
Полученный компилятор способен собирать крупные проекты с открытым исходным кодом, включая PostgreSQL, Redis, SQLite, FFmpeg и QEMU, а также прошёл 99% стресс-тестов GCC. Среди самых впечатляющих достижений — компиляция и запуск игры Doom.
Но есть и ограничения. Например, отсутствует 16-битный бэкенд для x86, необходимый для загрузки Linux в реальном режиме, а собственный ассемблер и компоновщик работают с ошибками. Код, сгенерированный на Rust, менее оптимален по сравнению с тем, что написал бы опытный программист. Новые функции и исправления ошибок часто нарушали работу. Эксперимент также показал практический предел автономного агентного кодирования — около 100 000 строк кода. После этого модели теряют согласованность и эффективность. По словам Карлини, это иллюстрирует ограничения современных ИИ-агентов при решении сложных, долгосрочных задач.
Реальная автономность проекта вызывает сомнения. Основная работа заключалась не в написании кода ИИ-агентами, а в создании сложнейшей инфраструктуры и «костылей» вокруг них. Разработчикам пришлось вручную проектировать конвейеры непрерывной интеграции и системы фильтрации контекста, чтобы модели не «забывали» задачу из-за обилия данных.
У Claude отсутствовало «чувство времени», из-за чего модель могла застревать на одних и тех же ошибках. Чтобы избежать этого, инженерам пришлось внедрять специальные механизмы контроля.
Заявленная стоимость в $20 000 отражает лишь «верхушку айсберга» — фактические затраты на токены API. За кадром остаются миллиардные инвестиции в обучение самой модели, интеллектуальный вклад исследователей и десятилетия труда поколений инженеров. Именно их работа по созданию эталонных компиляторов и наборов тестов заложила тот фундамент, без которого успех проекта был бы просто невозможен.
Тем не менее, достижение демонстрирует качественный скачок в возможностях ИИ. Еще год назад создание функционального компилятора даже под строгим надзором было невозможным. Сам Карлини выражает тревогу по поводу будущего индустрии. Его пугает перспектива массового развертывания программного обеспечения, которое программисты-люди никогда лично не проверяли и до конца не понимают.

