Как сообщает The Verge, Voicemod уже несколько лет работает на рынке систем для преобразования голоса. Услугами стартапа пользуются музыкальные студии, технологические компании и рекламные бренды. Однако если прошлые продукты Voicemod работали на базе обычного ПО и существующих инструментов, то платформа AI Voices выполняет все свои операции с помощью алгоритмов.
«Важно отметить, что эти голоса на базе ИИ — это не просто „клонирование голоса“. Они представляют собой сплав из технологий и творчества, которые позволят вам исследовать новые сценарии применения и вдохновляться, как никогда раньше», — утверждают в Voicemod.
Сервис AI Voices полностью автономен и не требует от своих пользователей сложных действий. Все, что требуется от клиента Voicemod — говорить внятно и не спеша, не дышать в микрофон, избегать слов паразитов и убедиться в отсутствии фоновых шумов. Если эти правила соблюдаются, ИИ будет улавливать слова за десятую долю секунды, а затем преобразовывать голос пользователя в голос виртуального персонажа. В компании также отметили, что рекомендуют говорить через AI Voices по-английски, однако алгоритмы способны озвучить человека и на других языках.
Все данные для голосов, представленных на платформе, были сгенерированы при участии профессиональных актеров озвучивания и звукорежиссеров. Актеры зачитывали различные сценарии, в то время как ИИ запоминал уникальные особенности произношения, вроде тембра и манеры голоса. Затем звукорежиссеры корректировали ошибки алгоритмов и прогоняли их по аудиодорожкам снова, пока система не научилась в точности копировать голоса людей. Некоторые виртуальные персонажи сейчас также поставляются с динамическими эффектами, фильтрами и фоновой музыкой.
Основная версия Voicemod сейчас доступна только на ПК, а разработчики открывают доступ клиентам по приглашениям. В ближайшее время компания обещает запустить версию для macOS и мобильных устройств.