«Голосовые помощники так и останутся тупыми, если не изменить подход к ИИ»
Logo
Cover

Борис Кац из MIT всю жизнь помогает машинам освоить человеческий язык. И пришел к выводу, что современные методы машинного обучения не способны сделать из Alexa или Siri достойных собеседников. Но препятствие к освоению языка он называет необычное.

31

За последние 40 лет старший научный сотрудник Борис Кац внес большой вклад в лингвистические способности машин. В 80-х он разработал START, систему, отвечающую на устные вопросы. Его идеи помогли IBM Watson победить в телевикторине Jeopardy! (аналог «Своей игры») и заложили фундамент для появления современных болтливых голосовых помощников.

Но сейчас Кац обеспокоен тем, что технология не развивается должным образом. По его убеждению, все идеи, которые там циркулируют, были придуманы десятки лет назад, и они не способны дать машинам настоящий искусственный интеллект.

Не стесняясь в выражениях, Кац называет программы Siri, Alexa и прочих голосовых помощников «невероятно тупыми» и считает, что гордиться тут особо нечем.

«По большому счету, современные методы — статистические технологии вроде машинного и глубокого обучения — очень хорошо ищут закономерности. А поскольку люди обычно произносят одно и то же предложение по нескольку раз, очень просто найти их в языке», — говорит он в интервью MIT Technology Review.

Посмотрите на подсказки для ввода слов в смартфоне. Машина лучше вас знает, что вы собираетесь сказать. Можно, конечно, называть это интеллектом, но по сути это всего лишь подсчет слов и чисел.

Поскольку мы повторяем одно и то же, легко создать систему, которая заметит закономерности и будет выдавать себя за умную. Такова фиктивная природа большинства современных процессов, считает ученый.

Ключ к интеллекту

Человек учится владеть языком совсем не так, как современные компьютеры.  Мы не оставляем младенца в колыбели с энциклопедией, в надежде что так он научится говорить. Ребенок сталкивается с предметом и начинает изучать его свойства. Рано или поздно он слышит от взрослых название этого предмета. Так рождается понимание.

Когда мы видим предмет или явление, мы пытаемся описать его. Когда слышим, как кто-то называет их, мы представляем образ. Люди живут в окружении материальных предметов, постоянно получают визуальную, тактильную и словесную информацию, которая позволяет детям постигать мир и учиться языку одновременно.

Возможно, считает Кац, изучая эти виды ощущений в отдельности, мы лишь усложняем проблему.

Было бы лучше, если бы мы сначала разобрались в том, как работает человеческий интеллект, а потом уже приступали к созданию машинного. ИИ должен опираться на идеи, основанные на психологии, когнитивных науках и нейробиологии, модели ИИ — отражать то, что известно о том, как человек учится и постигает мир.

«Настоящий прогресс произойдет только тогда, когда разработчики выйдут из своих офисов и начнут разговаривать со специалистами из других областей знаний. Вместе мы сможем приблизиться к пониманию интеллекта и тому, как воплотить его в машине, способной говорить, видеть и действовать в нашем материальном мире», — говорит Кац.

Недавно в японском робоотеле «уволили» половину сотрудников — то есть отправили их на свалку. Несмотря на опасения многих, там роботы не смогли отнять работу у людей.