Logo
Cover

Созданный в Университете Торонто алгоритм должен избавить робомобили от ошибок при взаимодействии трех разных составляющих системы принятия решений. Здесь их объединили в одну нейросеть, которая обрабатывает информацию всего за 30 миллисекунд. Отметим, что именно автопилот Uber первым насмерть сбил человека.

Традиционно систему ориентации автопилота на дороге рассматривают как взаимодействие трех составляющих: ИИ должен распознать ближайшие объекты, отследить их траектории, а также предсказать их поведение в ближайшие секунды. Все это позволяет спланировать безопасную траекторию. Как указывает Phys.org, неверное суждение на любом из трех этапов может привести к аварии.

Команда исследователей из Торонто совместно с Uber Advanced Technologies Group решила объединить все три задачи в одном алгоритме. Главная цель — исключить возможность ошибок взаимодействия. Но, помимо прочего, новый алгоритм стал намного быстрее. Детали о нем расскажут на конференции по машинному зрению в Солт-Лейк-Сити в ходе доклада с говорящим названием «Fast and Furious: Real Time End-to-End 3-D Detection».

По утверждению авторов, анализ одного изображения с использованием их нейросети занимает лишь 30 миллисекунд.

Для достижения такого феноменального результата исследователи применили сразу несколько необычных подходов, рассказала руководитель команды Ракель Уртазун.

Так, приоритет при анализе дорожной обстановки был отдан не камерам, а лидарам — датчикам, указывающим на расстояние до объекта. В отличие от области обработки изображения с помощью алгоритмов, тут обучение системы заняло значительно больше времени. В этом помогли предоставленные Uber данные о 6500 различных ситуациях — в совокупности более миллиона кадров.

Если бы ИИ работал с фотографиями, каждый объект нужно было бы идентифицировать, потратив ресурсы на их распознавание и «просмотр» обширных пространств между отдельными объектами. Уртазун объясняет, что для обучении ИИ на основе данных лидара — хаотичных раскиданных по пространству точек, находящихся на разном удалении от наблюдателя — потребовалось разработать новый подход.

Исследователям удалось в этом хаосе выделить ключевые регионы, на проработку которых компьютер робомобиля сможет гибко выделять необходимые ресурсы. Это сделало алгоритм намного быстрее — примерно в 10 раз.

Команда Уртазун представит на конференции в Солт-Лейк-Сити девять различных работ. Создание анализирующей дорожную обстановку нейросети описывается в работе «SBNet: Sparse Blocks Network for Fast Inference».

В Университете Торонто считают, что такой подход можно будет использовать в других сферах. Однако, как подчеркивает Уртазун, сейчас ученые сконцентрировались на автономном вождении, которое она называет одной из «фундаментальных проблем столетия».

На прошлой неделе «Яндекс» отчитался о первой успешной дальней поездке своего роботакси — автомобиль проехал из Москвы в Казань, причем на 99% без вмешательства человека.