Logo
Cover

Международная группа ученых представила систему, которая сканирует рукописный текст на английском и определяет, откуда родом его автор. ИИ уже научился распознавать выходцев из Китая, Индии и Ирана. Разработчики считают, что технология пригодится при расследований преступлений. Однако есть риск, что применение алгоритмов для определения национальности станет инструментом дискриминации.

4

Команда исследователей из Индии, Китая и Малайзии научила алгоритм находить в почерке маркеры национальной принадлежности. Система Cloud of Line Distribution (COLD) анализирует рукописный текст на английском и отыскивает признаки, которые указывают на владение другим языком.

Алгоритм строит свои выводы на простых закономерностях. К примеру, китайцы часто делают латинские буквы более квадратными, так как привыкли писать иероглифы. В то же время жители Индии и Бангладеш обладают более закругленным почерком, что также характерно для их родной письменности.

Пока ИИ определяет по почерку только пять национальностей: малайцев, иранцев, китайцев, индийцев и бенгальцев. Как поясняет Fast Company, для создания базы данных ученые попросили 100 волонтеров-иностранцев написать 500 строчек на английском языке. После этого алгоритм научили прослеживать сходные паттерны в их письме. 

Исследователи предлагают использовать методику для расследования преступлений. В последние годы полиция все чаще стала применять биометрию при поиске преступников. Анализ почерка, как считают ученые, может стать таким же эффективным инструментом, что и распознавание лиц. 

Хотя разработчики алгоритма COLD утверждают, что система по точности превосходит многие аналоги, ее пока нельзя применять для ведения следствия. ИИ-графолог обучен на слишком маленькой базе данных, что автоматически ставит под вопрос достоверность его результатов.

Более того, любые попытки применить ИИ для определения этнической и национальной принадлежности пока вызывают слишком много этических вопросов.

Ответов на них пока нет, но аналогичные системы уже подвергаются жесткой критике. Так, в мае на сайте московского стартапа Ntech Lab появилась информация о новой функции распознавания этнической принадлежности человека по записям с камер видеонаблюдения. Компания специализируется на системах распознавания лиц, а ее алгоритмы определяют возраст человека с вероятностью 95%, а пол — с вероятностью 99%. Сразу после публикации стартап обвинили в дискриминации, расизме и ксенофобии, а Ntech Lab пришлось принести извинения. 

У многих вызвал вопрос и факт сотрудничества Ntech Lab с властями. Недавно компания приняла решение закрыть проект FindFace, который позволял искать пользователей «ВКонтакте» по фотографии. Именно эта разработка принесла стартапу популярность, однако Ntech Lab больше не заинтересована в развитии сервиса. Теперь компания переключится на создание систем наблюдения для государства и частных предприятий.