Logo
Cover

Команда разработчиков искусственного интеллекта DeepMind научила виртуальных гуманоидов работать сообща, играя в мяч. При этом правил игры машине никто не объяснял, она до всего доходила сама, через наблюдение и повторение. Постепенно под руководством алгоритмов неуклюжие человечки с реалистичными пропорциями и массой превратились в профессионалов своего дела. На то, чтобы приобрести базовые навыки игры в футбол у ИИ ушло 24 часа реального времени. И еще три недели на то, чтобы научиться играть в команде.

Для принадлежащей Alphabet компании DeepMind обучение нейросети играм стало уже привычным делом. В прошлом британские специалисты уже помогли ИИ овладеть шахматами и го, а затем покером и компьютерной стратегией Starcraft. Теперь, похоже, они готовы взяться за спортивные игры на открытом воздухе.

Исследователи научили модель, имитирующую футболистов, играть в мяч два на два в рамках эксперимента по созданию передовой системы координации между ИИ. Дело не только в присущей британцам любви к футболу — усилия разработчиков подчинены глобальной задаче построения универсального, или сильного искусственного интеллекта, способного постигать мир наравне с человеком, пишет ZME Science.

Новый проект DeepMind — попытка исследования так называемого телесного интеллекта. Вполне возможно, что однажды универсальному ИИ придется перемещаться в материальном мире в какой-либо физической форме, и характер этой формы будет определять ее поведение в пространстве.

«Наши агенты приобрели такие навыки, как проворство, передача паса и разделение труда, что было продемонстрировано статистически, — написали авторы в блоге. — Игроки показывают и высокочастотную регуляцию моторики, и долгосрочное принятие решений, которое включает оценку поведения члена команды, что приводит к скоординированной командной игре».

Такой результат был достигнут в несколько этапов: сначала собрали видеозаписи настоящих футбольных матчей и показали их ИИ, чтобы тот постарался сымитировать движения игроков. Затем модели машинного обучения с вознаграждением помогли виртуальным человечкам отработать обводку и точные удары по мячу. Две эти фазы потребовали 1,5 лет в масштабе времени моделирования или 24 часа реального времени.

Однако более сложное поведение начало возникать только после последующего моделирования. Исследователи поставили перед цифровыми гуманоидами задачу набрать как можно больше очков в матчах двое на двое. В процессе они на протяжении трех недель учились играть в команде, например, вовремя передавать пас.

Тренировки проходили по упрощенным правилам, допускающим фолы, без ударов от ворот и вбрасываний.

Недавно нейросеть DeepMind раскрыла структуру почти всех белков, известных науке. Раньше алгоритм AlphaFold, разработанный в 2018 году, умел распутывать структуру лишь небольшой доли таких белков.