На первом этапе технология стала доступна для авторов, которые публикуют познавательные видео, например, обучают аудиторию готовить или шить. По задумке разработчиков, такая функция сделает материалы понятнее для зрителей из разных регионов, увеличив охват и улучшив восприятие контента.
Новинку впервые представили на конференции VidCon в прошлом году, а в основе системы лежат возможности ИИ-модели Gemini от Google. Автоматический дубляж пытается воспринимать речь как связную последовательность, а не как набор статичных слов, что повышает точность перевода и помогает быстрее адаптировать ролики.
По словам компании, технология пока не гарантирует идеальный результат. «Мы очень стараемся улучшить точность, но иногда перевод может оказаться не совсем корректным, а голос в дубляже —не похожим на оригинального автора», — отметили представители YouTube в своём блоге, призывая к обратной связи для дальнейшей доработки инструмента.
В скором времени планируется внедрить функцию «Expressive Speech», которая позволит голосу звучать эмоциональнее, а также воспроизводить окружающие звуки исходного видеоматериала. Кроме того, YouTube намерен со временем расширить перечень контента, для которого доступна эта опция, чтобы предоставить авторам ещё больше возможностей для привлечения международной аудитории.