Hitech logo

Идеи

Новая технология позволяет отдавать голосовые команды бесшумно

TODO:
Георгий Голованов14 октября 2022 г., 10:12

Хотя управлять устройством голосом чаще всего удобней и быстрее, чем через приложение, бывают обстоятельства, когда произносить команды вслух не хочется — например, когда вокруг шумно, полно людей или нужно соблюдать тишину. Система EarCommand предлагает альтернативу: она считывает команды, которые пользователь произносит беззвучно, через ушной канал.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Технологию разработала команда из Университета Нью-Йорка в Баффало (США). В его основе — наблюдение: если мы беззвучно произносим слова, задействованные мышцы и кости вызывают определенную деформацию ушного канала, которую можно соотнести со словами, рассказывает New Atlas.

Что касается аппаратного обеспечения, EarCommand состоит из похожего на беспроводной наушник устройства, состоящего из направленного внутрь динамика, подающего ультразвуковые сигналы в ухо владельца. Все эти сигналы отражаются от внутренней поверхности ушного канала и попадают на микрофон. Компьютер анализирует эхо, используя разработанный исследователями алгоритм, и распознает команды.

В проведенных испытаниях пользователи произносили про себя 32 разных односложных команды и 25 команд, состоящих из нескольких слов. Система распознала большинство сказанного — процент ошибок составил 10,2% для односложных команд и 12,3% для фраз. При дальнейшем усовершенствовании технологии количество ошибок должно снизиться.

К преимуществам изобретения относится то, что его работе на мешает медицинская маска, шарф или другой предмет одежды, закрывающий рот. Кроме того, в отличие от других систем чтения по губам, эта не требует камеры.

Инженеры из Facebook AI Research Labs разработали алгоритм, понимающий по активности мозга, что слышит человек. Система сканирует мозговые волны с помощью ЭЭГ-аппарата, а затем определяет, какие слова и предложения человек слышал раньше или слышит сейчас. Пока технология распространяется только на входящие данные.