Hitech logo

искусственный интеллект

ИИ Facebook различает 5 одновременно говорящих голосов собеседников

TODO:
Георгий Голованов13 июля 2020 г., 09:26

В исследовании, подготовленном для Международной конференции машинного обучения (ICML) 2020, специалисты из Facebook описали метод выделения до пяти голосов, говорящих одновременно в один микрофон. Разработчики утверждают, что их технология превосходит по производительности существующие аналоги.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Выделение речи из шума разговора — важный шаг к появлению эффективных коммуникационных технологий, от голосовых сообщений и записи музыкальных произведений до искусственного интеллекта.

Специалисты из Facebook разработали рекуррентную нейронную сеть для создания модели, которая обрабатывает последовательности аудиоданных переменной длины. Статья была представлена на Международной конференции машинного обучения (ICML) 2020, пишет VentureBeat.

Модель использует кодирующую сеть, которая отображает звуковые волны в виде скрытого представления. Затем сеть выделения голоса трансформирует эти представления в аудиосигнал каждого говорящего. Алгоритм должен знать общее число собеседников, но подсистема может автоматически определять говорящих и выбирать речевую модель соответственно.

Разработчики обучили несколько моделей выделять голоса двух, трех, четырех и пяти собеседников. Они убеждены, что такая система способна улучшить качество звука слуховых аппаратов — пользователь сможет различать голоса в шумных помещениях, например, на вечеринках или в ресторанах.

Следующим этапом станет оптимизация модели до состояния, когда уровень ее производительности станет соответствовать требованиям прикладного применения.

Распознавать нечеткую речь людей с нарушениями дикции или боковым амиотрофическим склерозом научили алгоритм специалисты из Google. Для этого им пришлось собрать образцы речи людей с проблемным произношением или с различными акцентами.