Logo
Cover

В 2020 году алгоритм машинного обучения GPT-3 начал составлять связные тексты, прочитав интернет. В этом году его родственник DALLE-2 научился создавать сюрреалистичные изображения по словесным описаниям. Новая разработка OpenAI — модель, постигшая принципы игры в Minecraft.

По сравнению с рядом других алгоритмов Minecraft, которые действуют в упрощенных версиях этой видеоигры, новый ИИ выступает наравне с людьми, вводя стандартные команды с клавиатуры и мыши. Посмотрев 70 000 часов игрового видео на YouTube, алгоритм овладел базовыми навыками: рубить деревья, изготавливать доски и строить верстаки. Также он научился плавать, охотиться, готовить пищу и прыгать, пишет Singularity Hub.

После тонкой настройки — обучения модели на более специализированном наборе данных — разработчики обнаружили, что алгоритм стал выполнять все эти задачи более эффективно, а также совершенствовал свои технологические навыки, изготавливая деревянные и каменные орудия и строя убежища, исследуя деревни и обыскивая сундуки.

В итоге он смог изготовить алмазную кирку — человеку на это требуется примерно 20 минут и примерно 24 000 действий.

Для игры с открытым миром это хороший результат. ИИ уже овладел шахматами и го, где есть четкие цели и измеряемый прогресс, но Minecraft сложнее, поскольку он менее линейный. Успех OpenAI строится, как и в случае GPT-3 или DALLE-2, на больших массивах данных для обучения, созданных людьми. Но не только. Просто видео процесса игры не так эффективно в обучении, поскольку не помогает понять, каким образом достигается та или иная цель. Поэтому OpenAI заплатила подрядчикам за 2000 часов размеченного видео, в котором базовые навыки Minecraft соотносятся с командами. С помощью этих данных был создан второй алгоритм, который уже сам разметил 70 000 часов видео из YouTube.

Разработанный Fаcebook и исследователями из США алгоритм дал в 2019 году бой 12 профессионалам покера, впервые обыграв людей за столом с шестью игроками, а не один на один. ИИ зарабатывал по $1000 в час.