Исследование: 52% ответов ChatGPT на вопросы по программированию неверны

Кейсы

Дарина Житова27 мая 2024 г., 10:20

Дарина Житова27 мая 2024 г., 10:20

Ажиотаж вокруг ИИ не обошёл и программистов — многие из них предпочитают обращаться за советом к ChatGPT, а не к специализированным ресурсам. Из-за этого Stack Overflow был вынужден уволить 30% своих сотрудников. Однако оказалось, что полагаться на новую технологию ещё рано — она «косячит» чаще, чем в половине случаев.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Как показало исследование, представленное командой специалистов из Университета Пердью на конференции Computer-Human Interaction, ChatGPT — ненадежный советчик для программистов. Ученые выяснили, что 52% ответов, сгенерированных ChatGPT, содержат ошибки и неточности. Они проанализировали 517 вопросов со Stack Overflow и также обнаружили, что 77% ответов от ChatGPT более многословны, чем ответы людей, а 78% ответов отличаются от человеческих по степени несоответствия.

Конгрессу США показали видео как НЛО «поглотил» удар ракеты Hellfire

Исследование также включало лингвистический анализ 2000 случайных ответов ChatGPT. Команда обнаружила, что ответы ИИ более формальные и при этом выражают меньше негативных эмоций. Проще говоря, типичный ответ ChatGPT похож на параграф из доступно написанного учебника, а сам чат-бот не склонен критиковать спрашивающего. Он предельно вежлив даже если отвечает на самые глупые вопросы.

В ходе опроса 12 программистов выяснилось, что 35% из них предпочитают ответы ChatGPT и не замечают ошибок в 39% случаев. Вероятно, последнее происходит как раз из-за характерного тона речи ИИ, которому люди подсознательно склонны доверять. Исследователи отмечают, что многие пользователи снижают бдительность из-за вежливого обращения, четко сформулированных ответов в стиле учебника и их полноты. Это делает советы ChatGPT более убедительными, несмотря на содержащиеся в них ошибки. Кроме того, к чат-боту могут чаще обращаться люди, которые боятся критики и грубости со стороны консультантов-людей.

Исследование показывает, что у ChatGPT еще много недостатков. Однако это не утешает уволенных сотрудников Stack Overflow и программистов, которым приходится искать ошибки в коде, написанном ИИ.

Также по теме

Кейсы

Скорость Starlink в 15 странах вышла на показатели наземных провайдеров

Кейсы

В "сердце" хромосом нашли ДНК неизвестных предков человека

Кейсы

Из Лос-Анджелеса в Вегас на электрокаре: 8 часов в пути и еще 5 - на зарядке

Кейсы

ИИ расшифровал эмоции семи видов животных

Новости СМИ2