Hitech logo

Обучение машин

В Стэнфорде роботов научили понимать, чего хотят люди

TODO:
Георгий Голованов25 июня 2019 г., 10:46

Скомбинировав два совсем разных метода постановки задач роботам в единый процесс, инженеры добились лучших показателей в интерпретации человеческих указаний.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Если перед автономной системой поставить задачу оптимизировать скорость передвижения в компьютерной игре, можно получить неожиданные результаты. Например, машина начнет быстро ездить по кругу, а не по нужному маршруту. Потому что в инструкциях не было сказано, что следует непременно ехать прямо, и робот начал импровизировать. Подобная проблема и заставила Дорсу Садиг и ее коллег начать поиски более эффективного метода постановки задач для автономных систем, пишет Stanford News.

«В будущем в мире будет больше автономных систем, и они должны понимать, что такое хорошо, а что такое плохо», — сказал Энди Палан, один из участников проекта.

Разработанная инженерами система инструкций для роботов — так называемых функций вознаграждения — сочетает примеры, в которых люди показывают роботам, что им делать, с данными опроса, в которых они объясняют, как машины должны себя вести. Первый подход очень информативный, но в нем слишком много лишнего. Второй, наоборот, очень точен, но без подробностей. Ученые объединили два источника данных, чтобы роботы смогли лучше понять, чего от них хотят люди.

Например, когда робот изучает то, как действуют водители за рулем, чтобы научиться самому управлять машиной, он не всегда может отличить важное от второстепенного или даже ненужного. Люди не всегда водят идеально, и многим разработчикам автопилотов хотелось бы, чтобы ИИ вел машину менее агрессивно, чем водители-люди. Дополнительные инструкции восполняют этот пробел, указывая алгоритму на первоочередные задачи.

В дальнейшем команда собирается внести в разработанный ими метод возможность создавать функции вознаграждения для различных ситуаций. К примеру, научить автопилот вести машину более осторожно, когда на дороге много машин, и более агрессивно, когда их почти нет.

Еще один шаг к пониманию человека сделал ИИ, созданный американскими учеными. Алгоритм распознает нюансы в крике ребенка и отличает капризы от сигналов болезни.