OpenAI — некоммерческая организация, и ее исследователи имеют возможность заниматься не только созданием утилитарных алгоритмов. Там решили проверить, как будет действовать ИИ, наделенный любопытством.
В ходе эксперимента ИИ пытался предсказать, каким будет следующий кадр. Однако верным действием считалось такое, которое максимально не соответствовало прогнозу. Исследователи посчитали, что нейросеть будет более успешно предсказывать события в знакомом окружении, а ошибки указывают на появление новых факторов.
Когда алгоритм испытали на классических компьютерных играх-аркадах, такой подход оказался хорошим подспорьем. Новое окружение в них часто означает новый уровень, и здесь «машинного любопытства» оказалось достаточно, чтобы штурмовать один уровень за другим. При этом компьютер изначально не был осведомлен об условиях победы.
Однако время от времени проявлялись и побочные эффекты такого подхода. Например, экран с надписью «Игра окончена» — тоже новое впечатление. И алгоритм намеренно выбирал действия, которые приводили к поражению и концу игры.
Однако еще более пагубным оказалось воздействие на любопытный ИИ телевидения.
Как сообщает Quartz, получив в свое распоряжение виртуальный пульт управления телевизором, алгоритм быстро выработал идеальную стратегию генерации новых образов и принялся переключать каналы в случайном порядке. Найти для него более интересное занятие оказалось невероятно сложно.
Недавно в OpenAI научили команду ИИ-ботов играть в Dota 2. В битве с профессиональными игроками-людьми ИИ победил, но во многом за счет особых настроек игры и «телепатии».