Чтобы смоделировать процесс принятия решений агентом, L-IBM сначала анализирует поведение человека и факторы, которые на него влияют. «Другими словами, мы стремимся смоделировать не только то, что агенты хотят сделать, но и то, что они действительно сделают в конкретной ситуации», — говорят исследователи. На первом этапе ученые наблюдали за агентами, которые оказывались в лабиринте в случайных точках. Исследователи использовали модель L-IBM для понимания ограничений их мышления и вычислений, а также предсказания поведения. Этот анализ выявил цели агента, а также способность ориентироваться и принимать сложные решения.
На следующем этапе модель L-IBM изучила речевые сигналы и подсказки, связанные с общением. Для исследования этого аспекта ученые провели игру с участием спикера и слушателя. Слушателю предоставляли набор разных цветов, он выбирал один, но не мог напрямую сообщить говорящему название выбранного цвета. Задача говорящего — описать цвет слушающему с помощью естественно-языковых высказываний (по сути, говорящий дает подсказки, используя различные слова). Если слушатель выбирает тот же цвет, что и говорящий, они оба побеждают. Целью ученых было выяснить, насколько люди учитывают контекст и реакции партнеров в коммуникации, и как эти навыки влияют на успешность их общения.
На третьем этапе исследователи изучили то, сколько времени игроки тратят на обдумывание ходов в шахматной партии. Они также обратили внимание на разницу во времени, которое более слабые и сильные шахматисты тратили на обдумывание своих ходов. Ученые поняли, что «глубина планирования», или то, как долго человек думает над проблемой, является хорошим показателем его поведения. Ученые передали эти данные в L-IBM и смоделировали вариативность решений игроков в разных игровых ситуациях.
«Вычислительный бюджет» (результат работы L-IBM) точно отразил разницу между тем, как размышляют слабые и сильные шахматисты. По словам ученых, этот результат оказался очень легко интерпретируемым. Он показывает, что более сложные задачи требуют большего планирования, а сильный игрок — это тот, кто планирует на несколько ходов вперед. Иными словами, если модель искусственного интеллекта знает, кто из игроков сильнее, она с большей вероятностью сможет точно предсказать победителя партии.
Эти три этапа демонстрируют, что L-IBM способна моделировать практически все аспекты принятия решений людьми, включая повседневные действия, поведение, общение и стратегию. L-IBM превосходит классические модели, одновременно оценивая человеческие навыки и сложность задач. Отличие L-IBM от предыдущих моделей заключается в том, что вместо случайных данных она учитывает прошлое поведение и ограничения агента для получения результатов.
Текущее исследование позволит ученым эффективнее обучать искусственный интеллект деталям человеческого поведения. Если ИИ-агент предсказывает ошибки людей, основываясь на их предыдущих действиях, он сможет вмешаться и предложить лучший способ решения задачи. Такой агент также будет адаптироваться к слабым сторонам человека.