Baidu показала систему синхронного перевода между двумя любыми языками
Logo
Cover

Китайский ИТ-гигант преследует Google по всем направлениям. Созданный в Китае алгоритм научился эффективно переводить даже с самых сложных языков. Для этого он фактически предсказывает ход разговора.

В идеальном мире перевод должен происходить, как в лучших произведениях научной фантастики: вставляешь специальный гаджет в ухо — и вот уже понимаешь речь не незнакомом языке. В реальности пока приходится довольствоваться посредничеством мобильных приложений. Но это тоже не проблема, если перевод происходит практически синхронно, считают в Baidu. И теперь компания представила соответствующий продвинутый переводчик, пишет Spectrum.

Simultaneous Translation with Anticipation and Controllable Latency (STACL) использует сложные алгоритмы обработки речи, которые улавливают первые несколько слов, а дальше предсказывают, что скажет человек. Система настраиваемая — в зависимости от сложности переводимого языка пользователь может установить задержку.

В течение этого времени переводчик внимательно слушает, что говорит человек, и только затем начинает переводить.

Это эффективно при работе со сложными переводами, например, с китайского на английский. Как работает система, компания показала в демонстрационном ролике.

«Что особенно примечательно в нашем проекте, так это возможность предвосхищать слова пользователя. Порой система бежит на несколько секунд впереди самого говорящего. Живые переводчики очень часто поступают подобным образом — не ждут конца предложения. И научить этому ИИ очень важно для развития и внедрения технологии», — говорит представитель ИИ-лаборатории Baidu в Кремниевой долине.

Создатели сравнивают STACL с реальными переводчиками, которые работают в ООН. У них одна из самых напряженных работ, поэтому они переводят командами, меняясь каждые 10-30 минут. Одна из больших сложностей, по их словам, разные уровни и структуры переводимых языков. Одна из популярных шуток у них: «Почему переводчик с немецкого на английский застрял и молчит?» «Он ждет глагола». В немецком глагол всегда идет в конце, поэтому нельзя сразу сказать, чем закончится предложение. И современные системы синхронного перевода в таких случаях ждут завершения предложения. Из-за этого работа замедляется.

Китайская система обучается на огромном количестве переводов и знает, как, скорее всего, закончится то или иное предложение, поэтому работает быстрее

Эффективно переводить стремятся не только поисковые гиганты. Программисты Facebook утверждают, что нашли способ переводить даже с самых редких языков. Для решения проблемы разработчики применили неконтролируемую модель обучения ИИ, при которой программа работает с минимальными исходными данными. Алгоритм тренируется не на текстах, а на парах слов. Система усваивает их векторные репрезентации, то есть учится по контексту и по одному слову предсказывать, что стоит перед ним и после него.