Роботы Figure 02 теперь могут имитировать человеческие движения: они ставят пятку на землю, отталкиваются носком и синхронно размахивают руками. Для этого компания Figure использовала обучение с подкреплением (RL), которое вознаграждает роботов за имитацию человеческой походки. При этом отслеживается скорость, энергоэффективность и надежность.
В новом видео десять роботов Figure 02 работают на одной нейросети без изменений. Это показывает, что технология масштабируема и подойдет для развертывания тысяч роботов без ручной настройки.
Обучение с подкреплением основано на развитии навыков через вознаграждение. Тренировка проходила в высокоточной физической симуляции с ускорением на графическом процессоре, что позволило быстро смоделировать годы данных в течение нескольких часов. Тысячи виртуальных гуманоидов с различными физическими параметрами запускались параллельно.
Роботов помещали в условия, приближенные к реальному миру. Там они учились ходить по разному ландшафту и справляться с трудностями, например, скольжением или толчками. Благодаря обширной обучающей среде роботы научились двигаться, используя одну общую политику нейросети.
Главное преимущество подхода Figure — возможность прямого переноса обученной модели из симуляции на реальных роботов без дополнительной настройки. Компания утверждает, что это сокращает время разработки и повышает адаптивность андроидов.
В феврале Figure представила Helix — модель «зрение-язык-действие» (VLA), которая позволяет роботам воспринимать, понимать и выполнять действия. В результате они реагируют на команды в реальном времени и взаимодействуют с объектами. Фирма позиционирует себя как сильного конкурента в секторе гуманоидной робототехники, наряду с Tesla Optimus, Agility Robotics Digit и китайскими компаниями UBTech Robotics и Unitree Robotics.