Hitech logo

Кейсы

Алгоритм научился распознавать предметы, как человек

TODO:
Роман Окашин25 декабря 2018 г., 08:50

Исследователи из Школы инженерии Калифорнийского университета продемонстрировали систему распознавания объектов реального мира, которая делает это так же, как человек. Это ключевой шаг к созданию универсального ИИ, который будет видеть весь мир, а не отдельные объекты.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Главное достижение ученых из Калифорнии — увеличение универсальности системы. По их словам, действуя в том же направлении, они в конце концов создадут алгоритм, одинаково эффективно распознающий любые объекты реального мира. Машина с этим ПО будет видеть цельную картину мира, а не куски, на которые ее натаскали.

Сейчас ситуация противоположная. Алгоритмы распознавания очень мощные, но все они узкоспециализированы и развиваются исключительно в своих областях. Например, распознавание лиц: за год точность подобных алгоритмов выросла на 80%, а лидером в этом направлении стали китайские разработчики.

Такой алгоритм мгновенно найдет нужного человека из огромной выборки, но в качестве входных данных принимает лишь лица. Этот подход отличается от того, как учится видеть человек. Мы добавляем незнакомый предмет в качестве нового опыта — и получаем возможность распознавать и его. Такой подход и решили привить компьютеру американские разработчики.

Они создают систему, которая воспринимает цельную картину мира, а не только те части, на которые она натренирована. Это, например, позволит распознать собаку, которая спряталась за деревом, оставив на виду только хвост, лапы и нос. Человек легко идентифицирует животное, но современному ИИ пока тяжело догадаться, что скрывает массивный объект, пишет Science Daily.

Новый метод инженеров показывает способ, избавляющий ИИ от этих недостатков. Подход состоит из трех основных этапов. Для начала система разбивает изображение на маленькие кусочки. Затем компьютер устанавливает, как именно они сочетаются друг с другом, образуя рассматриваемый объект. И наконец, под изучение попадают другие объекты, находящиеся в окружающей объект области. ИИ пытается разобраться, имеет ли отношение информация об этих объектах к описанию и идентификации первичного объекта.

Чтобы помочь новой системе учиться, как люди, исследователи решили погрузить ее в интернет-копию нашего мира.

Преимуществом интернета для обучения называют наличие множества изображений и видео, на которых показаны объекты одного и того же типа, но всегда в разных контекстах и с разных точек зрения. В этой «матрице» ИИ, подобно младенцу, видит много примеров появления одного и того же объекта в разных контекстах.

Систему проверили на 9000 изображениях, и она легко определяла различные объекты без внешних инструкций и предварительного их маркирования.