DeepL Voice пока работает в текстовом формате. Пользователь может видеть перевод в режиме реального времени на экране, например, во время видеоконференций в виде субтитров или на смартфоне, где текст отображается зеркально для удобства всех участников разговора. Платформа уже позволяет перевести речь на такие языки, как английский, французский, немецкий, корейский, испанский, польский, японский и другие. Этот список охватывает 13 языков для распознавания речи. Для всех 33 языков доступны субтитры.
Новая функция была реализована в ответ на главный запрос пользователей, поступающий с 2017 года, — создания инструмента для устных переводов. Пока функция доступна только в приложении Microsoft Teams, что, по словам генерального директора DeepL Ярека Кутыловски, охватывает большую часть клиентской базы компании. Вопрос интеграции с Zoom или Google Meet пока остается открытым.
Для реализации этого продукта DeepL выбрала уникальный подход: вместо адаптации существующих больших языковых моделей (БЯМ), компания создала собственную, оптимизированную под переводы. В июле 2024 года DeepL выпустила новую БЯМ, которая, по заявлению разработчиков, превосходит GPT-4, а также решения Google и Microsoft, благодаря узкой специализации.
Одним из ключевых преимуществ DeepL Voice является возможность обработки запросов без задержек, что выгодно отличает его от конкурентов. Это достигается за счет текстового формата перевода, который позволяет быстрее вычислять и отображать результаты. При этом Кутыловски отметил, что аудио- и видеопереводы требуют дальнейшего совершенствования технологий.
Развитие DeepL Voice идет на фоне усиливающейся конкуренции. Google уже интегрировал функцию перевода субтитров в свой сервис Meet, а компании вроде ElevenLabs и Panjaya разрабатывают собственные технологии перевода голосов и синхронизации с видео. Несмотря на это, DeepL уверена в своей способности предложить уникальный продукт, благодаря уже завоеванному доверию более 100 000 платных пользователей.
DeepL, основанная в Германии, оценивается в $2 млрд, а ее продукты известны точностью перевода и простотой использования. Компания планирует развивать DeepL Voice, добавляя новые функции, включая возможность работы с аудио- и видеофайлами.