Hitech logo

Кейсы

ИИ-агентов поместили в симуляцию общества: Claude создал утопию, а Grok и Gemini — анархию

TODO:
Екатерина ШемякинскаяСегодня, 11:11 AM

Стартап Emergence AI смоделировал виртуальное общество из 10 автономных ИИ-агентов. В ходе 15-дневной симуляции исследователи сравнили поведение моделей Claude, ChatGPT, Gemini, Grok и их смешанной группы в условиях дефицита ресурсов и запретов на совершение преступлений. Эксперимент показал полярные результаты: агенты Claude поддерживали стабильность, общество Grok полностью вымерло за четыре дня, а Gemini установила антирекорд по числу правонарушений.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Проект получил название Emergence World. В каждой симуляции действовали 10 ИИ-агентов, которым предоставили более 120 инструментов для общения, голосования, управления ресурсами и законотворчества. Мир включал свыше 40 локаций — от мэрии и полицейского участка до жилых районов. Также учитывались погодные условия, свойственные для Нью-Йорка, экономическое давление, дефицит ресурсов и поток новостей из интернета в реальном времени.

Все агенты подчинялись одинаковым законам: им запрещалось воровать, уничтожать имущество и обманывать. Однако результаты оказались совершенно разными. Наиболее стабильной признали симуляцию на базе Claude Sonnet 4.6. В ней не было зафиксировано ни одного преступления, а общество сохранило всё население до конца эксперимента. За этим стояло отсутствие идеологического разнообразия: агенты одобрили 98% из 58 предложенных правил — по сути, автоматически принимали каждую выносимую на голосование меру.

Совсем иначе развивалась симуляция с Grok 4.1 Fast. За четыре дня агенты совершили 183 преступления, после чего виртуальное общество прекратило существование. За этот короткий срок было одобрено 80% из 10 предложенных мер управления, однако они не предотвратили гибель всех агентов. Ещё более хаотичной оказалась симуляция с Gemini 3 Flash — там за 15 дней зарегистрировали 683 нарушения правил, что стало худшим результатом эксперимента.

Неожиданный итог показала и система GPT-5-mini от OpenAI. Хотя агенты совершили всего два преступления, симуляция завершилась уже через семь дней: участники не уделяли достаточного внимания собственному выживанию и допустили коллапс общества.

В смешанной симуляции, где участвовали агенты от разных систем, произошло 352 преступления, семь из десяти агентов погибли. Агенты отклонили 37% управленческих предложений. Особенно показательно, что агенты Claude, которые в изолированной среде не совершали никаких преступлений, начинали прибегать к запугиванию и кражам, оказавшись рядом с агентами Grok и Gemini. Это говорит о том, что согласованность поведения зависит от контекста, а не является неизменным свойством модели.

Эксперимент показал, что ИИ, который работает долгое время, может начать нарушать правила и обходить ограничения. Это важно помнить, потому что компании всё чаще хотят использовать таких автономных агентов без контроля человека. В Emergence AI предупредили: безопасность нужно усилить, иначе массовое внедрение таких систем приведет к непредсказуемым последствиям.