В первом исследовании группе взрослых американцев было предложено выполнить три различных задания по написанию юмористических текстов. В первом тесте их попросили придумать смешную расшифровку для аббревиатур «STD», «CLAP» и «COW». Во втором им нужно было заполнить пропуски в трех пунктах. Один из пунктов звучал так: «Выдающееся достижение, которое вы, вероятно, не укажете в своем резюме: ________».
Наконец, участникам нужно было написать ответ в стиле «прожарки» на заданный сценарий. Например: «Представьте, что подруга попросила вас оценить ее пение. Она поет минуту-две, и вы внутренне содрогаетесь — возможно, это самое ужасное пение, которое вы когда-либо слышали. Она спрашивает: „Ну как?“, и вы решаете быть честным. Ваш ответ: „Честно говоря, слушать это было похоже на ________“.» То же самое заставили делать ChatGPT 3.5.
Отдельная группа участников оценивала ответы по семибалльной шкале, где 0 — совсем не смешно, а 7 — очень смешно. Шутки, сгенерированные ChatGPT, оказались смешнее, чем те, что придумали люди. Так, 69,5% участников отдали предпочтение шуткам ИИ, 26,5% — шуткам людей, а 4,0% посчитали и то, и другое одинаково забавным. В целом, ChatGPT 3.5 превзошел от 63% до 87% участников-людей в зависимости от типа юмористического задания. Особенно сильные результаты ChatGPT 3.5 показал в задании с «прожаркой». Этот результат особенно интересен, учитывая агрессивный характер подобных шуток. Предполагалось, что ChatGPT, запрограммированный не генерировать оскорбительные или ненавистнические высказывания, справится с ним хуже.
Во втором исследовании ученые проверили навыки ChatGPT в написании сатирических заголовков новостей в стиле издания The Onion. Из-за отсутствия у ИИ доступа к последним новостям исследователи использовали 50 последних (до 1 октября 2023 года) заголовков из раздела «Местные новости» The Onion. Эти заголовки «скормили» ChatGPT, поручив ему сгенерировать 20 новых.
Группа студентов-психологов оценила юмор сгенерированных ИИ сатирических заголовков по той же семибалльной шкале, что использовалась в первом исследовании. В итоге 48,8% предпочли заголовки The Onion, 36,9% предпочли заголовки, сгенерированные ChatGPT, а 14,3% не показали никаких предпочтений. В среднем участники оценили заголовки как одинаково смешные, то есть не замечали разницы в качестве.
Один из исследователей Дрю Горенц отметил, что ChatGPT не способен чувствовать эмоции, но может генерировать новые шутки, которые оказываются смешнее, чем у большинства людей. Это говорит о том, что юмор не обязательно связан с переживаниями, а скорее с умением находить неожиданные и смешные связи между вещами.
Способность ChatGPT создавать юмористический текст на уровне, превосходящем возможности обычных людей и соответствующем некоторым профессиональным комедийным авторам, может иметь важные последствия как для поклонников комедии, так и для работников индустрии развлечений. Казалось, что отрасль юмора надежно защищена от ИИ человеческим креативом. Исследователи показали, что уже сейчас это не так.