ИИ Facebook различает 5 одновременно говорящих голосов собеседников

искусственный интеллект

Георгий Голованов13 июля 2020 г., 09:26

Георгий Голованов13 июля 2020 г., 09:26

В исследовании, подготовленном для Международной конференции машинного обучения (ICML) 2020, специалисты из Facebook описали метод выделения до пяти голосов, говорящих одновременно в один микрофон. Разработчики утверждают, что их технология превосходит по производительности существующие аналоги.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Выделение речи из шума разговора — важный шаг к появлению эффективных коммуникационных технологий, от голосовых сообщений и записи музыкальных произведений до искусственного интеллекта.

«Если ИИ — это мозг робота, то RPA — его руки». Что умеют программные роботы

Специалисты из Facebook разработали рекуррентную нейронную сеть для создания модели, которая обрабатывает последовательности аудиоданных переменной длины. Статья была представлена на Международной конференции машинного обучения (ICML) 2020, пишет VentureBeat.

Модель использует кодирующую сеть, которая отображает звуковые волны в виде скрытого представления. Затем сеть выделения голоса трансформирует эти представления в аудиосигнал каждого говорящего. Алгоритм должен знать общее число собеседников, но подсистема может автоматически определять говорящих и выбирать речевую модель соответственно.

Разработчики обучили несколько моделей выделять голоса двух, трех, четырех и пяти собеседников. Они убеждены, что такая система способна улучшить качество звука слуховых аппаратов — пользователь сможет различать голоса в шумных помещениях, например, на вечеринках или в ресторанах.

Следующим этапом станет оптимизация модели до состояния, когда уровень ее производительности станет соответствовать требованиям прикладного применения.

Распознавать нечеткую речь людей с нарушениями дикции или боковым амиотрофическим склерозом научили алгоритм специалисты из Google. Для этого им пришлось собрать образцы речи людей с проблемным произношением или с различными акцентами.

Также по теме

Идеи

Эксперимент вскрыл неожиданное препятствие для переноса тепла в плазме

Идеи

Автономное грузовое судно прошло почти 800 км без участия человека

Идеи

Китайская прорывная батарея может стать частью оружия будущего

Идеи

Анализ группы крови неандертальцев показал их низкое генетическое разнообразие

Новости СМИ2