Группа ученых из Техасского университета в Остине разработала революционный алгоритм машинного обучения: авторы утверждают, что впервые научили робота ориентироваться в незнакомой ситуации так, как это делает человек. ИИ достраивает полную картину окружающего по нескольким «быстрым взглядам».
Глава команды Кристин Грауман подчеркивает, что это делает алгоритм не только быстрым, но и гибким: «Наш агент готов к новым задачам восприятия в необычной среде по мере их возникновения. Он универсален и успешно справляется с различными задачами, изучив полезные паттерны о визуальном мире».
Алгоритм натренировали на сотнях 360-градусных панорам, приучив ориентироваться во многих типах окружений. Теперь ему достаточно 20% сцены — остаток достраивает ИИ.
Как отмечает Science Daily, для современного этапа развития машинного обучения это нехарактерно. Автономные роботы обычно обучаются навигации в строго определенном окружении, например, на фабрике. Причем обучающим сэмплам часто необходима дополнительная разметка, а самой фабрике — специальные навигационные указатели.
Грауман говорит, что с новым подходом роботы, наконец, станут универсальными: «[Агент] учится делать разумные предположения о том, где собирать визуальную информацию, чтобы преуспеть в задачах восприятия».
Она сравнивает поведение программы с тем, как действует человек в новом универмаге: на основании предыдущего опыта все мы примерно знаем, где нужно искать определенные товары, но каждый раз вносим поправки.
Еще одна задача — самая сложная, по мнению Грауман — была связана с жесткими ограничениями по времени принятия решений. Это критичный параметр для робота-спасателя, подчеркивает она. Впрочем, для того, чтобы система заработала, предстоит интегрировать вторую часть алгоритма — двигательную. Нынешний ИИ лишь формирует представления об окружающем и не планирует перемещения.