Наделенный любопытством ИИ предпочел не учиться, а смотреть телевизор
Logo
Cover

В лаборатории OpenAI провели необычный эксперимент: там создали ИИ, который обучается не на основе наград и достижений, а исключительно благодаря «врожденному» любопытству. Правда, некоторые способы получения новой информации оказались для такого алгоритма разрушительными.

88927

OpenAI — некоммерческая организация, и ее исследователи имеют возможность заниматься не только созданием утилитарных алгоритмов. Там решили проверить, как будет действовать ИИ, наделенный любопытством.

В ходе эксперимента ИИ пытался предсказать, каким будет следующий кадр. Однако верным действием считалось такое, которое максимально не соответствовало прогнозу. Исследователи посчитали, что нейросеть будет более успешно предсказывать события в знакомом окружении, а ошибки указывают на появление новых факторов.

Когда алгоритм испытали на классических компьютерных играх-аркадах, такой подход оказался хорошим подспорьем. Новое окружение в них часто означает новый уровень, и здесь «машинного любопытства» оказалось достаточно, чтобы штурмовать один уровень за другим. При этом компьютер изначально не был осведомлен об условиях победы.

Однако время от времени проявлялись и побочные эффекты такого подхода. Например, экран с надписью «Игра окончена» — тоже новое впечатление. И алгоритм намеренно выбирал действия, которые приводили к поражению и концу игры.

Однако еще более пагубным оказалось воздействие на любопытный ИИ телевидения.

Как сообщает Quartz, получив в свое распоряжение виртуальный пульт управления телевизором, алгоритм быстро выработал идеальную стратегию генерации новых образов и принялся переключать каналы в случайном порядке. Найти для него более интересное занятие оказалось невероятно сложно.

Недавно в OpenAI научили команду ИИ-ботов играть в Dota 2. В битве с профессиональными игроками-людьми ИИ победил, но во многом за счет особых настроек игры и «телепатии».