На видео робот Optimus от Tesla вытаскивает футболку из корзины и аккуратно складывает ее. Но все не так впечатляюще, как кажется на первый взгляд. Спустя 23 минуты после публикации видео Маск пояснил, что Optimus складывает эту рубашку не сам — им управляет человек посредством телеприсутствия. На это указывала перчатка управления в кадре.
Optimus безусловно обладает разнообразными навыками, от танцев до завязывания шнурков под управлением человека-оператора. Аппаратное обеспечение позволяет ему уверенно совершать различные движения, как и другим гуманоидам. Однако куда важнее, что Optimus может делать самостоятельно. У Tesla есть серьезные возможности в области искусственного интеллекта и автономности. Поэтому с их стороны странно публиковать видео, которое подразумевают автономию, только для того, чтобы через 20 минут уточнить, что робот управляется человеком.
Tesla представила гуманоидного робота Optimus в 2022 году. В сентябре 2023 года Tesla сообщила, что Optimus обучается с помощью нейронных сетей и может выполнять новые задачи, такие как автономная сортировка объектов. В прошлом месяце Tesla представила Optimus Gen 2, новое поколение своего робота-гуманоида. Optimus Gen 2 на 10 кг легче и на 30% быстрее. Его движения стали больше напоминать человеческие.
В ближайшие месяцы и годы может появиться сотни таких видеороликов. Гуманоиды начинают потихоньку осваивать базовые способности. Затем они, вероятно, перейдут к более сложным задачам и, в конечном итоге, будут выполнять работу полностью автономно в динамичной среде.
В 2024 году роботы-гуманоиды могут впервые начать работать на складах и в заводских цехах, выполняя реальные полезные задачи, которые ранее лежали на человеке. К этому стремятся многие компании. Однако для достижения этой цели необходимо научить роботов учиться. Умение ходить на двух ногах — это одно, но способность принимать инструкции и выполнять полезные задачи — совсем другое.
За последние месяцы был достигнут значительный прогресс в разработке мультимодального искусственного интеллекта, способного анализировать и интерпретировать видео, а затем управлять роботами, чтобы воспроизводить процессы, которые они видят. Один из примеров — демонстрация модели больших поведенческих реакций Toyota в сентябре. Генеральный директор компании Figure Бретт Адкок называет это «моментом ChatGPT» для гуманоидной робототехники. Недавно компания показала, как андроид Figure 01 автономно пользуется кофемашиной. Он смог научиться этому после просмотра 10 часов видео, на котором люди выполняют аналогичные действия. При этом Figure работает над созданием человекоподобного робота всего чуть более года.