Hitech logo

машинное обучение

ИИ научился правильно определять смысл многозначных слов

TODO:
Георгий Голованов18 июня 2018 г., 09:34

Если бы люди использовали в речи только однозначные слова и термины, машины понимали бы нас гораздо лучше. Нейросеть ELMo, получившая на прошлой неделе приз за лучшее исследование Ассоциации компьютерной лингвистики Северной Америки (NAACL), помогает ИИ вникать в смысл многозначных слов и на 25% улучшает работу алгоритмов распознавания речи.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Полисемия — весьма распространенное явление, и человек научился определять точный вариант значения по контексту и структуре предложения. Если мы слышим: «Боже, храни королеву!», то понимаем, что речь идет о правящей особе. А когда кто-то говорит: «Я пожертвовал королевой», то скорее всего разговор идет о шахматной партии.

У систем машинного обучения, однако, нет такой гибкости. Если они видят многозначное слово, то перебирают все его словарные значения и выбирают нечто среднее. В некоторых случаях этого бывает достаточно, в других — грубо искажает смысл. ELMo позволяет системам искусственного интеллекта ориентироваться в полисемии. Нейросеть использует огромную коллекцию текстов для того, чтобы определить, имеет ли слово несколько значений, и как они отражены в языке, пишет TechCrunch.

Например, в примере с королевами один текст явно относится к настольной игре, а в другом говорится о членах монаршей семьи. Можно, конечно, вручную расставить тэги над всеми многозначными словами, но кто захочет проделывать такую работу с миллионами слов? «Мы искали метод, который значительно сократит потребность в ручном аннотировании, — говорит Мэтью Питерс, главный автор статьи. — Нашей целью было узнать как можно больше из немаркированных данных».

Вдобавок, по его словам, все существующие алгоритмы распознавания речи «сжимают все значения одного слова в один вектор».

«Так что мы начали с базового предположения: давайте изучать не один вектор значения слова, а бесконечное множество. Потому что смысл слова в высшей степени зависит от контекста», — говорит Питерс.

ELMo узнает истинное значение слова, анализируя сразу все предложение. Когда рядом с «королевой» появляется «валет», нейросеть определяет, что речь идет о карточной игре, а не о шахматах или придворных.

Результат пока не дотягивает до уровня владения языком «опытного пользователя», но технология улучшает алгоритмы распознавания речи на 25%. А поскольку этот метод, хоть и новый, но не совершенно другой, его легко интегрировать в существующие коммерческие системы Ии-переводчиков и голосовых помощников.   

Между тем, российская компания ABBYY обновила свое приложение для iOS. Теперь ее приложение TextGrabber умеет переводить тексты в реальном времени. Для этого достаточно навести на текст камеру смартфона.