Hitech logo

Кейсы

Google выпустила почти синхронный переводчик речи для 70+ языков

TODO:
Екатерина ШемякинскаяСегодня, 11:42 AM

Google представила Gemini 3.5 Live Translate — новую аудиомодель для перевода речи с минимальной задержкой. Система поддерживает более 70 языков, включая русский, и способна не только переводить сказанное, но и сохранять интонацию, темп речи и особенности голоса говорящего, обеспечивая более естественное общение между людьми.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

В отличие от традиционных систем голосового перевода, которые ждут окончания фразы перед выдачей результата, Gemini 3.5 Live Translate работает непрерывно. Модель анализирует речь на лету и генерирует перевод с задержкой всего в несколько секунд, что позволяет вести разговор почти без пауз.

Новая система автоматически распознаёт язык без необходимости ручной настройки и способна работать даже в шумной обстановке. Технология может использоваться для международных звонков, видеоконференций, онлайн-уроков, прямых трансляций и других сценариев, где требуется мгновенный перевод речи.

Gemini 3.5 Live Translate уже начинает внедряться в экосистеме Google. Разработчики получили доступ к модели через Gemini Live API и платформу Google AI Studio, корпоративные клиенты смогут протестировать её в Google Meet, а пользователи Android и iOS — воспользоваться новой функцией в приложении Google Translate.

Одним из первых крупных партнёров стала компания Grab, которая тестирует технологию для общения между водителями и пассажирами. Сервис обрабатывает более 10 млн голосовых звонков ежемесячно. По словам представителей Grab, модель продемонстрировала высокую точность перевода и низкую задержку.

Компания также начала закрытое тестирование функции среди корпоративных клиентов Google Workspace, а более широкий запуск запланирован на конец года. Обновленная версия сервиса расширила языковую поддержку с пяти до более чем 70 языков, что позволяет обеспечивать синхронный перевод для более чем 2000 языковых пар.

Для пользователей мобильного приложения Google Translate компания также подготовила новый «режим прослушивания». Владельцы Android-смартфонов смогут слышать переведённую речь напрямую через разговорный динамик устройства, просто приложив телефон к уху как во время обычного звонка. Все аудиоматериалы, созданные Gemini 3.5 Live Translate, дополнительно маркируются цифровым водяным знаком SynthID, который позволяет идентифицировать контент, сгенерированный искусственным интеллектом, и снижать риски распространения дезинформации.