ИИ с характером: ученые научились объяснять поведение алгоритмов

Кейсы

Екатерина Шемякинская18 января, 10:41

Екатерина Шемякинская18 января, 10:41

Одна из главных проблем в разработке искусственного интеллекта — невозможность понять, как и почему алгоритм принимает решения. Чтобы приблизиться к решению, ученые создали метод, который превращает сложные стратегии машины в понятные психологические профили. Помещая ИИ в хаотическую среду, они заставляли его эволюционировать, а затем с помощью другой ИИ-модели описывали его «личность», заглядывая внутрь «чёрного ящика».

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Современные алгоритмы искусственного интеллекта разрабатывают стратегии, которые дают отличные результаты, но остаются непонятными для их создателей. Исследователи попросту не могут объяснить, почему эти решения работают. Эта так называемая «проблема интерпретируемости» — одно из препятствий на пути к безопасному ИИ.

Telegram начал автоматически подключать пользователей из России к своему встроенному прокси

В недавней статье на arXiv ученые из Измирского технологического института предложили подход, который помогает лучше понять, что стоит за действиями ИИ. Исследование демонстрирует: искусственный интеллект, сталкиваясь с хаосом и стрессовыми факторами, может развивать стратегии, напоминающие индивидуальные черты личности, которые раньше считались прерогативой человека.

Ученые предложили ИИ решить итеративную дилемму заключенного из теории игр. Суть такова: два игрока выбирают между сотрудничеством и предательством. Если оба молчат, получают небольшой «штраф». Если один предает, он выходит «на свободу», а второй получает большой срок. Если оба предают — оба получают средний срок. Основная дилемма: сотрудничать или предавать? В многократных итерациях агенты должны были выработать стратегию, которая принесет наибольшую пользу.

Ранее большинство симуляций проводились в стерильной, идеализированной среде: действия выполнялись идеально, а выигрыши оставались постоянными. Теперь ученые ввели «Режим Бога» с пятью стрессовыми факторами: ошибки агентов, внезапное снижение вознаграждения, соблазн предательства, потеря памяти и слежка за противником.

С помощью алгоритма, напоминающего естественный отбор, агенты эволюционировали в течение 100 поколений: успешные стратегии «скрещивались», а неэффективные отбрасывались. В результате сформировались адаптированные агенты с уникальными поведенческими особенностями.

В идеальной среде ИИ демонстрировал высокую эффективность, но был уязвим к сбоям. Зато в хаотичных условиях выживали системы с более устойчивыми и сложными стратегиями, которые по своим чертам напоминали полноценные «личности».

Чтобы понять наиболее сильные модели, ученые провели четыре теста: измеряли склонность к агрессии, способность прощать после предательства, устойчивость к случайным ошибкам и жадность. Эти данные затем были переданы GPT-5.1, которая преобразовала числовые показатели в детализированные профили личности. Среди выявленных «личностей» был агент под прозвищем «Параноик-пацифист»: осторожный, склонный к сотрудничеству, но мгновенно реагирующий на предательство.

Метод позволяет заглянуть внутрь «черного ящика» ИИ и понять, почему стратегии работают. Это открывает путь к созданию объяснимого ИИ (XAI), повышает надежность систем и улучшает взаимодействие человека и искусственного интеллекта в реальном мире.

Также по теме

Кейсы

Маск построит новую трассу для реалистичных гонок капсул Hyperloop

Кейсы

Прототип гигантского носителя Super Heavy взорвался во время испытаний

Кейсы

ВОЗ: "Все страны должны подготовиться к эпидемии загадочного китайского вируса"

Кейсы

Tesla показала мир «глазами» автопилота

Новости СМИ2