Hitech logo

Идеи

Voicemod на лету превращает голоса пользователей в голоса знаменитостей

TODO:
Степан Икаев19 июня 2022 г., 15:30

Испанский стартап Voicemod запустил бета-версию своего сервиса AI Voices для генерации голосов знаменитостей и виртуальных персонажей. Платформа применяет алгоритмы машинного обучения для преобразования пользовательских голосов в режиме реального времени. Сейчас разработчик предлагает восемь «личностей», включая голос актера Моргана Фримена, и обещает добавить больше вариантов ближе к полноценному релизу.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Как сообщает The Verge, Voicemod уже несколько лет работает на рынке систем для преобразования голоса. Услугами стартапа пользуются музыкальные студии, технологические компании и рекламные бренды. Однако если прошлые продукты Voicemod работали на базе обычного ПО и существующих инструментов, то платформа AI Voices выполняет все свои операции с помощью алгоритмов.

«Важно отметить, что эти голоса на базе ИИ — это не просто „клонирование голоса“. Они представляют собой сплав из технологий и творчества, которые позволят вам исследовать новые сценарии применения и вдохновляться, как никогда раньше», — утверждают в Voicemod.

Сервис AI Voices полностью автономен и не требует от своих пользователей сложных действий. Все, что требуется от клиента Voicemod — говорить внятно и не спеша, не дышать в микрофон, избегать слов паразитов и убедиться в отсутствии фоновых шумов. Если эти правила соблюдаются, ИИ будет улавливать слова за десятую долю секунды, а затем преобразовывать голос пользователя в голос виртуального персонажа. В компании также отметили, что рекомендуют говорить через AI Voices по-английски, однако алгоритмы способны озвучить человека и на других языках.

Все данные для голосов, представленных на платформе, были сгенерированы при участии профессиональных актеров озвучивания и звукорежиссеров. Актеры зачитывали различные сценарии, в то время как ИИ запоминал уникальные особенности произношения, вроде тембра и манеры голоса. Затем звукорежиссеры корректировали ошибки алгоритмов и прогоняли их по аудиодорожкам снова, пока система не научилась в точности копировать голоса людей. Некоторые виртуальные персонажи сейчас также поставляются с динамическими эффектами, фильтрами и фоновой музыкой.

Основная версия Voicemod сейчас доступна только на ПК, а разработчики открывают доступ клиентам по приглашениям. В ближайшее время компания обещает запустить версию для macOS и мобильных устройств.