Новая технология позволяет отдавать голосовые команды бесшумно

Идеи

Георгий Голованов14 октября 2022 г., 10:12

Георгий Голованов14 октября 2022 г., 10:12

Хотя управлять устройством голосом чаще всего удобней и быстрее, чем через приложение, бывают обстоятельства, когда произносить команды вслух не хочется — например, когда вокруг шумно, полно людей или нужно соблюдать тишину. Система EarCommand предлагает альтернативу: она считывает команды, которые пользователь произносит беззвучно, через ушной канал.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Технологию разработала команда из Университета Нью-Йорка в Баффало (США). В его основе — наблюдение: если мы беззвучно произносим слова, задействованные мышцы и кости вызывают определенную деформацию ушного канала, которую можно соотнести со словами, рассказывает New Atlas.

«Если ИИ — это мозг робота, то RPA — его руки». Что умеют программные роботы

Что касается аппаратного обеспечения, EarCommand состоит из похожего на беспроводной наушник устройства, состоящего из направленного внутрь динамика, подающего ультразвуковые сигналы в ухо владельца. Все эти сигналы отражаются от внутренней поверхности ушного канала и попадают на микрофон. Компьютер анализирует эхо, используя разработанный исследователями алгоритм, и распознает команды.

В проведенных испытаниях пользователи произносили про себя 32 разных односложных команды и 25 команд, состоящих из нескольких слов. Система распознала большинство сказанного — процент ошибок составил 10,2% для односложных команд и 12,3% для фраз. При дальнейшем усовершенствовании технологии количество ошибок должно снизиться.

К преимуществам изобретения относится то, что его работе на мешает медицинская маска, шарф или другой предмет одежды, закрывающий рот. Кроме того, в отличие от других систем чтения по губам, эта не требует камеры.

Инженеры из Facebook AI Research Labs разработали алгоритм, понимающий по активности мозга, что слышит человек. Система сканирует мозговые волны с помощью ЭЭГ-аппарата, а затем определяет, какие слова и предложения человек слышал раньше или слышит сейчас. Пока технология распространяется только на входящие данные.

Также по теме

Идеи

Чем сильнее социальное неравенство, тем хуже у всех детей успехи в математике

Идеи

Команда студентов побила 4-минутный рекорд быстрой зарядки электромобиля

Идеи

Ученые обнаружили поразительное сходство между мозгом человека и Вселенной

Идеи

Разработаны квантовые вентили с точностью 99,98%

Новости СМИ2