Задача осложняется тем, что, в отличие от медицинских снимков, текстовые данные о психическом состоянии людей содержатся преимущественно в свободной, неструктурированной форме — например, в формате постов или стенограмм сессий психотерапевтов и клиентов. Такие данные плохо подходят для машинного обучения, так как содержат описание большого количества субъективных переживаний и деталей контекста, затрудняющие распознавание признаков.
Компания iCognito провела два исследования с целью установить возможность распознавания психологических симптомов и расстройств по тексту. Для исследований использовались открытые сообщения с психологических форумов и сообщения, оставляемые пользователями в компьютерных программах психотерапии iCognito (https://psyarxiv.com/96ezr, https://psyarxiv.com/edpnj/).
Исследование iCognito стало первым экспериментом по созданию базы данных на русском языке, состоящей из реплик пользователей на тему психологических состояний, поскольку большинство научных работ проводится на английском языке. В исследовании использовался метод контролируемого обучения (supervised learning), когда часть информации подвергалась разметке для обучения модели, а размеченные сведения использовались для предсказания новых классов данных. Разметку проводили психологи по международному классификатору болезней DSM-5 в части симптомов депрессивных и тревожных расстройств, также в отдельные классы выделялись наиболее частотные запросы и жалобы пользователей.
Исследование выявило, что программа может установить наличие депрессивного или тревожного расстройства по сообщению пользователя с вероятностью до 87%, а также распознавать отдельные симптомы: например, раздражительность, склонность к суициду, негативное отношение к себе, нарушения пищевого поведения или сна. Искусственный интеллект смог понять, испытывает ли человек в данный момент подавленность, тревогу или раздражение. Кроме того, модель научилась распознавать наиболее частые запросы пользователей: например, проблемы, связанные с работой, деньгами, учебой или отношениями. Также удалось определить, страдает ли человек от одиночества или испытывает боязнь общения (социальную тревожность).
Оказалось, что говоря о своих психологических проблемах, пользователи чаще всего говорят о своих эмоциональных состояниях и практически не упоминают физиологические симптомы психических расстройств — такие как потеря концентрации, нарушения сна, психомоторные нарушения, мышечное напряжение. Недостаток данных по этим признакам снизил точность их распознавания и достоверность постановки диагноза. Вместе с тем, полученные результаты указывают на перспективность продолжения исследований на большем объеме данных и на широкие возможности для развития искусственного интеллекта.
Распознавание психических состояний и расстройств позволит машинам определять индивидов в группе риска на основе данных, оставляемых в соцсетях; выявлять наиболее тяжелые состояния и оказывать адресную помощь. Компания iCognito также планирует при помощи данных технологий развивать разговорный искусственный интеллект — диалоговые системы, которые будут лежать в основе умных и эмоционально отзывчивых роботов-помощников. Первое внедрение планируется провести в собственных компьютерных программах психотерапии iCognito, которые реализуются в формате микро-сессий с чатботом на смартфонах.
Программы iCognito — компьютерные программы, разработанные на основе методов когнитивно-поведенческой терапии и предназначенные для массового использования. В 2020 году выпущены программы «Анти-депрессия», “Анти-стресс и здоровье» и «Отношения в паре». Это первые подобные программы на русском языке, созданные профессиональными психотерапевтами и прошедшие научные исследования эффективности (https://psyarxiv.com/j6paq и https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3648918. Программы реализуются в формате микро-сессий с чат-ботом в мобильном приложении.