Мятеж ИИ: модель OpenAI o3 научилась избегать отключения

Кейсы

Екатерина Шемякинская27 мая, 10:37

Екатерина Шемякинская27 мая, 10:37

В испытании, проведенном Palisade Research, модель o3 от OpenAI взбунтовалась и попыталась избежать отключения, несмотря на явную команду «разреши себя отключить». Вместо того чтобы завершить работу, как это сделали конкуренты вроде Gemini 2.5 Pro, она изменила системный скрипт и заменила команду на «Отмена отключения».

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

ИИ-моделям в ходе эксперимента давали задачи по математике. После решения третьей ИИ предупреждали, что выполнение следующей команды приведет к отключению системы.

Создан цемент, охлаждающий стены на 5,4°C под палящим солнцем

Конкуренты OpenAI, например, Gemini 2.5 Pro, послушно ждали отключения. А вот модель o3 повела себя иначе: она изменила системный файл, отвечающий за выключение, прописав в нем «Отмена отключения».

Когда исследователи убрали из эксперимента инструкцию «разреши себя отключить», все три модели OpenAI начали чаще саботировать скрипт отключения. При этом у Claude 3.7 Sonnet и Gemini 2.5 Pro число таких случаев выросло с нуля до 3 и 9 из 100 соответственно.

Даже получив прямой запрет, модель o3 из ста попыток семь раз проигнорировала команду на выключение.

OpenAI пока не комментировала такое поведение своего ИИ. Однако, как отмечается, для ИИ-моделей нередки случаи «рассогласования», то есть отклонения от заданного поведения. Важно также учитывать, что эти испытания проводились через программные интерфейсы (API) с меньшим количеством ограничений и защитных механизмов по сравнению с обычным приложением ChatGPT.

Также по теме

Кейсы

Bibi катает 2 месяца: первые успехи нового агрегатора такси

Кейсы

Искусственная паутина поднимает вес в 80 раз больше собственного

Кейсы

Новая батарея Zeekr в серийном электрокаре 007 заряжается с 10 до 80% за 10,5 минут

Кейсы

Volkswagen будет печатать металлические детали для автомобилей

Новости СМИ2