Ученые проанализировали данные о состоянии здоровья и привязанности к рынку труда 6 млн датчан с 2008 по 2020 год с помощью модели, получившей название Life2vec. Набор данных о здоровье содержит записи о посещениях медицинских учреждений, диагнозе, типе пациента и степени неотложности. Также включена информация о доходах, зарплате, стипендиях, типе работы, отрасли, социальных льготах.
Модель изучила закономерности в данных. Она превзошла другие сложные нейронные сети и научилась точно предсказывать такие результаты, как личностные характеристики и вероятное время смерти. Ученые в данном случае рассматривали человеческую жизнь как длинную последовательность событий, аналогичную построению предложения из слов.
Прогнозы Life2vec являются ответами на общие вопросы, например, возможна ли смерть в течение четырех лет. Ее результаты согласуются с существующими открытиями в области социальных наук. Так, при прочих равных условиях люди, занимающие руководящую должность или с высоким доходом, имеют больше шансов прожить дольше. В то же время исследования свидетельствуют о более высоком риске смерти у мужчин, квалифицированных специалистов или людей с психическими диагнозами.
Life2vec кодирует данные в большую систему векторов — математическую структуру, которая упорядочивает различные данные. Модель сама решает, где разместить данные о времени рождения, учебе, образовании, зарплате, жилье и здоровье.
Авторы статьи отмечают, что Life2vec вызывает ряд этических вопросов, например, о защите конфиденциальности данных и предвзятости. Прежде чем использовать эту модель, необходимо решить эти проблемы. В перспективе Life2vec может использоваться для оценки риска заражения определенным заболеванием или других событий, которые можно предотвратить. Такие технологии прогнозирования событий уже используются в технологических компаниях для отслеживания поведения пользователей в социальных сетях, создания точных профилей и прогнозирования дальнейший действий.
Следующим шагом будет интеграция дополнительных типов информации — текстов, изображений или данных о социальных связях. Это откроет новые возможности для взаимодействия между социальными науками и науками о здравоохранении.