Около трех месяцев назад Facebook пригласила ученых подавать предложения на исследования в трех областях обработки естественного языка (NLP) — пограничной дисциплины, объединяющей лингвистику и машинное обучение. В особенности компанию интересовали «надежные» подходы к NLP и эффективная с точки зрения вычислений NLP вдобавок к машинным переводам на низкоресурсные диалекты.
Как выяснилось, это было только начало. В сегодняшнем сообщении в блоге Facebook опубликовала 11 предложений, которые были отобраны из 115 предложений от команд из 35 стран. Кроме того, компания объявила о создании AI Language Research Consortium — консорциума партнеров по совместной работе над технологией естественной обработки языка, сообщает VentureBeat.
Только что сформированная группа займется вопросами обучения представлениям, пониманием контента, диалоговыми системами, вычленением информации, анализом настроения, обобщением, сбором и очисткой данных и переводом устной речи.
Вдобавок к сотрудничеству с Facebook члены консорциума получат финансирование на свои исследования, смогут принять участие в ежегодном исследовательском семинаре и конференциях.
Формирование такого консорциума можно считать ответом Facebook на созданный Amazon в 2015 году фонд Alexa Fund, который предоставляет до $200 млн венчурного капитала на инновации в области голосовых технологий и поддерживает молодых исследователей, работающих над проблемами преобразования текста в речь, разговорного ИИ, автоматического распознавания речи и NLP.
Однако миссия консорциума Facebook выглядит менее привязанной к платформе — по крайней мере, на первый взгляд. С этой точки зрения она больше похожа на программы грантов вроде AI for Good, созданные Google для поддержки социально значимых проектов, или инициативы Microsoft, направленные на решение проблем экологии, здравоохранения и сохранения культурного наследия.
Год назад Facebook сообщила о достижении своего алгоритма: компьютер научился качественно переводить с редких языков или на них. Разработчики применили неконтролируемую модель обучения, при которой программа работает с минимальными исходными данными.