Роборука обучилась манипулировать предметами без вмешательства человека
Logo
Cover

Компания OpenAI использовала машинное обучение, чтобы научить руку быстро и эффективно взаимодействовать с любыми объектами. Инструменты ИИ позволили инженерам избежать долгого процесса программирования каждого отдельного элемента. Вместо этого рука сразу училась на множестве случайных сценариев, причем без участия человека.

За всю историю развития робототехники машины так и не сравнились по ловкости и плавности движений с людьми или животными. Нынешние роботы движутся медленно, фазы движений выражены и, как правило, отделены одна от другой. В созданной Илоном Маском некоммерческой организации OpenAI решили бороться с этим стереотипом, пишет Sciencemag.

При этом автоматический манипулятор от OpenAI учился обращаться с предметами без вмешательства человека — и теперь достаточно свободно обращается с кубиком, воспроизводя комбинации букв, которые от нее требуют.

Автономная рука — лишь первый объект для испытаний нового подхода с использованием машинного обучения. Главное преимущество самостоятельного обучения — отсутствие необходимости программировать сотни сценариев по отдельности.

OpenAI использовала для отработки алгоритма уже готовую коммерческую роборуку. После этого ученые создали виртуальную имитацию этой руки — и именно ее отправили «хватать» виртуальные предметы.

Чтобы научить симуляцию максимально ловко обращаться с кубиком, использовался метод обучения с подкреплением. Процесс обучения подразумевал постоянное усложнение сценариев: менялись цвета куба, его размеры, добавлялись визуальные шумы. Если переводить время компьютерного обучения в привычное человеку, то получится, что рука практиковалась работе с кубиком 100 лет.

После этого всю базу знаний передали механизмам управления механической рукой. ИИ дополнили камерами, которые позволяют алгоритму понимать, что сейчас происходит с объектом манипуляций. После чего роборуке выдали настоящий куб.

Ученые утверждают, что рука справилась даже лучше, чем они ожидали. Она установила новый рекорд последовательных и осмысленных смен позиций куба — 50. Ранее средним результатом считалось 13 последовательных смен.

В OpenAI подошли к проблеме отсутствия ловкости у роботов со стороны софта. Но без правильной аппаратной части будет сложно реализовать все то, чему обучается симуляция. Одно из направлений исследований, которое может дать машинам человеческую гибкость, — создание искусственных мышц. Ученые из Гонконгского университета представили материал, способный создавать движение под воздействием электроимпульсов или света. Именно такие «мышцы» смогут в будущем заменить моторы и приводы, без которых современные роботы просто не могут функционировать.