Новый человекоподобный робот Lingxi X2 — это компактная модель ростом 1,3 м и весом 33,8 кг. По словам разработчиков из AgiBot, это первый по-настоящему интерактивный «динамический робот». Он оснащён мультимодальной системой взаимодействия, которая реагирует на команды за миллисекунды. В видеоролике робот ходит, танцует, сидит, общается с инженером, жестикулирует и даже передвигается на велосипеде.
Анализируя мимику и тон голоса, Lingxi X2 может определять эмоциональное состояние, что позволяет ему давать уместные и искренние ответы. Особенности конструкции позволяют точно передавать эмоции: робот имитирует дыхание человека, незаметно «наблюдает» за окружающей обстановкой и демонстрирует жесты и движения, характерные для живого существа.
Робот справится с ролью домработника, уборщика и охранника, а еще его можно адаптировать для работы в здравоохранении, образовании и других областях.
Робот X2 выполняет простые задачи без предварительного обучения благодаря модели ИИ Genie Operator-1 (GO-1). Эта система обучается на данных от людей и роботов, адаптируется к новым задачам и работает на разных платформах. GO-1 использует метод скрытых действий, анализируя последовательность кадров для точного понимания движения. Это позволяет лучше обрабатывать данные, повышая гибкость и качество решений, а также упрощает взаимодействие между роботами.
«Мозг» робота использует Latent Planner, специализированную модель трансформера, для предсказания последовательности действий, обрабатывая данные от Vision-Language Model («языковые модели зрения»). Технология шумоподавления делает движения X2 более точными и плавными.
GO-1 обошла передовые модели, увеличив успешность выполнения задач с 46% до 78%. Особенно улучшились результаты в сложных задачах, таких как наливание воды и пополнение запасов напитков. Latent Planner повысил эффективность планирования действий на 12%.