Hitech logo

Идеи

Создан ИИ, способный плакать и передавать голосом глубокие эмоции

TODO:
Георгий Голованов13 мая 2020 г., 10:18

Когда речь заходит о голосовых помощниках вроде Алисы, Алексы или Сири, эпитеты «эмоциональный» или «выразительный» не кажутся подходящими. Скорее, они звучат нейтрально-вежливо — что неплохо для ассистента, но не для кино, игр или других повествовательных средств. Стартап Sonantic разрабатывает ИИ, умеющий убедительно плакать и передавать «глубокие человеческие эмоции».

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Британский стартап Sonantic, привлекший в апреле 2,3 млн евро, показал видео, в котором представлены возможности технологии искусственного интеллекта по имитации человеческих эмоций, пишет TechCrunch. Если так пойдет и дальше, актеры озвучивания останутся без работы.

Все голоса, которые можно услышать в этом демо-ролике, созданы ИИ.  

Продукт Sonantic — программа для редактирования звуковой информации, включающая множество различных голосовых моделей, созданных на основе голосов живых актеров. «Мы разбираемся во всех тонкостях голоса, нюансах дыхания, — пояснила Зина Куреши, сооснователь Sonantic. — Голос сам должен рассказывать историю».   

Не удивительно, что стартап уже сотрудничает с рядом производителей игр, которым часто приходится записывать тысячи строчек диалогов. Использование аудиоредактора позволит разрабатывать игру быстрее, менять голос под различные игровые обстоятельства — к примеру, если персонаж говорит на бегу — и не терять «естественность», когда по сценарию требуется заплакать или закричать.

Разработчики не считают, что их технология полностью вытеснит актеров, скорее, она должна стать чем-то вроде компьютерной графики в области звука. Она позволит рассказать новые истории фантастическим образом.

Нечто подобное, но для рекламных роликов, разрабатывают в Amazon. AWS запустила Brand Voice — сервис по превращению текста в естественно звучащий голос. То есть смоделированная на компьютере рекламная речь будет звучать так, как если бы ее произнес какой-нибудь известный человек.