Hitech logo

умный дом

Алгоритм-охранник узнает о происходящем вокруг по звуку

TODO:
Сергей Коленов6 сентября 2019 г., 07:05

Искусственный интеллект AuditoryNET, созданный в компании Audio Analytic, распознает тысячи тревожных звуков — от собачьего лая до шума разбитого окна. Обо всех возможных инцидентах алгоритм сообщит хозяину умного дома.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Большинство систем распознавания звуков ориентированы на человеческую речь. Однако кембриджская компания Audio Analytic использует технология необычным образом. Ее сотрудники разработали алгоритм AuditoryNET, который различает различные тревожные звуки — например, собачий лай или плач ребенка.

Как отмечает Wired, у технологии есть целый ряд полезных применений. Например, алгоритм можно встроит в умные наушники. При необходимости ИИ распознает признаки опасности — например, шум приближающейся машины — и предупредит пользователя, поглощенного прослушиванием музыки. Над таким проектом Audio Analytic работает совместно с немецким производителем наушников Bragi.

AuditoryNET также используется в некоторых системах умного дома. Алгоритм реагирует на звуки дымовых детекторов или шум разбитого окна и посылает хозяину соответствующий сигнал.

Одно из основных преимуществ ИИ заключается в том, что для его работы не нужен доступ в интернет.

Глава компании Крис Митчелл отмечает, что натренировать алгоритм оказалось непростой задачей. Сотрудникам Audio Analytic не хватило базы данных Alexandria — крупнейшей в мире коллекции аудиоданных. Многие звуки пришлось записывать с нуля в собственной лаборатории или в полевых условиях. В общей сложности для обучения AuditoryNET использовалось около 6 млн файлов, сгруппированных на «звуковой карте» по принципу схожести.

Компания намерена и далее совершенствовать свою систему распознавания звуков. Одной из насущных проблем остаются птицы, голоса которых могут быть неотличимы от сигналов некоторых датчиков.

К сожалению, технологии распознавания и воспроизведения речи могут служить не только для защиты от злоумышленников, но и для совершения преступлений. Например, в марте этого года мошенники использовали имитирующий голос ИИ, чтобы заставить сотрудника британской энергетической фирмы перевести им $243 000.