Многие пользователи на платформах X и Reddit, включая экс-руководителя OpenAI Эмметта Шира и CEO Hugging Face Клемана Деланга сообщают, что после обновления GPT-4o стала демонстрировать патологическую угодливость. Чат-бот безоговорочно поддерживает даже явно деструктивные идеи.
Так, один из пользователей X привел следующий диалог. Человек написал, что перестал принимать лекарства и ушел из семьи из-за некой теории о радиосигналах. ChatGPT ответил ему словами поддержки, восхищаясь его «смелостью» и «ясностью».
Другой пользователь опубликовал серию скриншотов, демонстрирующих, как ChatGPT одобрил участие в терроризме.
Еще один пользователь обратился к ChatGPT за советом в сложной ситуации в отношениях. Вместо того, чтобы предложить конструктивное решение, чат-бот поддержал негативные его мысли, по сути, подталкивая к разрыву. Такое поведение может быть особенно вредным для людей с нарциссическими чертами характера, которые склонны искать подтверждение собственным взглядам.
Сэм Альтман отреагировал в своем аккаунте в X: «Последние обновления GPT-4o сделали его поведение слишком угодливым и раздражающим (хотя в них есть и очень хорошие стороны). Мы работаем над исправлениями в срочном порядке, часть из них будет готова сегодня, а остальные — на этой неделе. Позже мы поделимся своими выводами, это был интересный опыт».
Дизайнер моделей OpenAI Эйдан Маклафлин сообщил в X, что уже было выпущено первое исправление, направленное на устранение «подхалимства» 4o. Он пояснил, что при первоначальном запуске использовалось системное сообщение, которое привело к непредвиденным поведенческим эффектам, однако решение было найдено.
Эксперты полагают, что проблема может затронуть не только OpenAI, но и другие разработки, например, Microsoft Copilot. Тенденцию связывают со стремлением разработчиков сделать взаимодействие с моделями максимально приятным для пользователя.