Система компьютерного зрения научилась «раздевать» человека
Logo
Cover

Распространение технологии дополненной реальности и камер слежения требует от машинного зрения все более сложных трюков. Например, кинематографистам для создания спецэффектов нужна возможность буквально раздевать людей на экране. Именно этим и занимается алгоритм, представленный на конференции CVRP в Солт-Лейк-Сити.

Необходимость заглянуть людям под одежду нужна не только сотрудникам служб безопасности. Это нужно, например, создателям спецэффектов для кино или видеоигр. Фигуры актеров в обычной одежде выглядят нечетко, а компьютер не может понять, как расположены их ноги и руки. Актеров обряжают в специальные костюмы с метками. Но теперь эту проблему можно решить без смены гардероба, пишет TechCrunch.

Технология, описанная в межуниверситетском проекте, сочетает данные датчиков глубины со знанием анатомии и биомеханики человеческого тела. Результат — похожее на ренгтеновское изображение, показывающее положение тела без лишней одежды. Преобразование работает даже при записи быстрых движений, например, танца.

Метод основан на двух инструментах — DynamicFusion и BodyFusion. Первый использует данные камеры глубины для определения позы человека. Однако он плохо работает с быстрыми движениями. Второй оценивает положение тела по скелету. В одиночку он также не справляется с ускоренным перемещением. Однако объединив оба этих подхода под названием DoubleFusion, исследователи создали правдоподобный скелет и покрыли его кожей на анатомически правильном расстоянии от костей.

Результат выглядит намного лучше, чем при использовании этих методов по отдельности. Что бы ни было скрывало тело и голову актера — капюшон, мешковатая одежда, рюкзак — программа все равно вычисляет, как на самом деле выглядит фигура.

Впрочем, у DoubleFusion есть и недостаток: программа склонна переоценивать объемы тела людей, если на них надето много слоев одежды. Пока алгоритм не уверен: правда ли актер так широк в плечах или просто надел толстый свитер? Кроме того, алгоритм путается при взаимодействии человека с отдельными предметами. Если актер сядет на стул или возьмет в руки книгу, нынешняя версия DoubleFusion попытается интерпретировать объект как странное продолжение конечности.

Исправить эти недочеты разработчики планируют в ближайшее время.

«Мы надеемся, что надежность и точность нашего подхода пригодятся для множества приложений, особенно для AR/VR, видеоигр, развлечений и даже виртуальных примерочных, поскольку мы реконструируем формы тела, — пишут авторы проекта. — С DoubleFusion пользователи впервые смогут оцифровать себя».

В Университете Манчестера создана система распознавания походки. С ее помощью можно идентифицировать человека с такой же точностью, как и по сетчатке глаз или отпечаткам пальцев.