Новый рекорд был установлен с использованием набора данных MS MARCO компании Microsoft — в нем собраны реальные вопросы, которые задают пользователи поисковой системы Bing, сообщает MIT Technology Review.
Нейросеть должна была обработать множество веб-страниц, чтобы ответить на вопросы типа: «Что такое корпорация?» (В данном случае правильным ответом было бы: «Корпорация — это компания или группа людей, уполномоченных действовать как единая организация и признанная в таком качестве законом».) Успехи ИИ измерялись по двум критериям и оказались равны или немного превосходили человеческие.
За рекордом алгоритма стоит большой и гибкий алгоритм машинного обучения и огромный объем изученных данных.
Команда Alibaba разработала метод, позволяющий ИИ, грубо говоря, отсеять нерелевантный текст, прежде чем пытаться отвечать на вопрос.
Улучшенные способности понимания текста помогут компании усовершенствовать чатботов, общающихся с мелкими торговцами, объяснил Сы Лоу, руководитель команды разработчиков. Поиск информации станет более естественным. Новый алгоритм станет частью облачных сервисов компании и сломает языковой барьер между бизнесменами разных стран.
В то же время Сы подчеркнул, что о настоящем понимании текста машинами говорить еще рано — алгоритм лишь выполняет статистическое распознавание паттернов, не представляя, что означают слова, которые он пишет.
Год назад компания Alimama, принадлежащая Alibaba, анонсировала ИИ-копирайтера. Алгоритм, по утверждению создателей, успешно прошел тест Тьюринга.