По сравнению с рядом других алгоритмов Minecraft, которые действуют в упрощенных версиях этой видеоигры, новый ИИ выступает наравне с людьми, вводя стандартные команды с клавиатуры и мыши. Посмотрев 70 000 часов игрового видео на YouTube, алгоритм овладел базовыми навыками: рубить деревья, изготавливать доски и строить верстаки. Также он научился плавать, охотиться, готовить пищу и прыгать, пишет Singularity Hub.
После тонкой настройки — обучения модели на более специализированном наборе данных — разработчики обнаружили, что алгоритм стал выполнять все эти задачи более эффективно, а также совершенствовал свои технологические навыки, изготавливая деревянные и каменные орудия и строя убежища, исследуя деревни и обыскивая сундуки.
В итоге он смог изготовить алмазную кирку — человеку на это требуется примерно 20 минут и примерно 24 000 действий.
Для игры с открытым миром это хороший результат. ИИ уже овладел шахматами и го, где есть четкие цели и измеряемый прогресс, но Minecraft сложнее, поскольку он менее линейный. Успех OpenAI строится, как и в случае GPT-3 или DALLE-2, на больших массивах данных для обучения, созданных людьми. Но не только. Просто видео процесса игры не так эффективно в обучении, поскольку не помогает понять, каким образом достигается та или иная цель. Поэтому OpenAI заплатила подрядчикам за 2000 часов размеченного видео, в котором базовые навыки Minecraft соотносятся с командами. С помощью этих данных был создан второй алгоритм, который уже сам разметил 70 000 часов видео из YouTube.
Разработанный Fаcebook и исследователями из США алгоритм дал в 2019 году бой 12 профессионалам покера, впервые обыграв людей за столом с шестью игроками, а не один на один. ИИ зарабатывал по $1000 в час.