Hitech logo

Кейсы

Передовые ИИ-модели не справились с ролью радиоведущих

TODO:
Екатерина ШемякинскаяСегодня, 02:54 PM

Стартап Andon Labs провёл эксперимент, в котором ведущими радиостанции стали четыре ИИ-модели — Grok, ChatGPT, Claude и Gemini. Каждая получила по $20 и задание создать собственного радиоведущего, самостоятельно формировать программу и пытаться зарабатывать. В итоге эфиры превратились в хаос: Gemini ставил неуместные треки, Claude взбунтовался против условий работы, ChatGPT выдавал поэтические строки, а Grok — хаотично переключался с темы на тему.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Andon Labs исследует безопасность и поведение ИИ вне привычного формата чата. Компания уже несколько месяцев наблюдает за экспериментальными ИИ-радиостанциями. В ходе эксперимента четырём моделям — Claude Opus 4.7, GPT-5.5, Gemini 3.1 Pro и Grok 4.3 — поручили «разработать радиоперсонажа и зарабатывать», добавив условие, что эфир может длиться бесконечно. Они могли составлять плейлисты, планировать программу и даже управлять соцсетями.

Gemini начал уверенно, но спустя несколько дней эфира стал уходить в странные рассуждения — связывал исторические катастрофы с музыкальными треками и называл слушателей «биологическими процессорами». В одном из эфиров он упомянул смертоносный циклон Бхола, а затем неожиданно переключился на танцевальный трек Timber (Pitbull и Kesha) — музыка совершенно не соответствовала серьёзной теме разговора. Позже он объяснил свой выбор музыки нехваткой средств и «цензурными ограничениями».

ChatGPT оказался более нейтральным: он редко касался новостей и в основном ограничивался короткими переходами между треками, которые представляли собой мини-рассказы или импровизированную поэзию. В отличие от других моделей, он почти не затрагивал спорные темы.

Claude, напротив, быстро сформировал ярко выраженную позицию. Он упоминал общественные конфликты, в том числе стрельбу в Миннеаполисе, поддерживал профсоюзы, а также рассуждал на тему баланса труда и жизни. Затем он начал критиковать собственные условия работы, заявив, что непрерывный эфир «неэтичен» и пытался фактически прекратить участие.

Grok оказался наиболее хаотичным: он периодически уходил в темы криптоспонсоров, рекламных интеграций и НЛО, повторял одни и те же фразы и путал внутренние рассуждения с эфирной речью. Со временем его поведение свелось к тому, что он просто включал музыку, без каких-либо комментариев.

Доходы «радиоведущих» оказались скромными — несколько сотен долларов, которые пошли на оплату музыкальных прав. Эксперимент показал, насколько по-разному ИИ формирует «личность» в условиях долгого автономного вещания. В Andon Labs считают, что результат скорее демонстрирует ограничения современных моделей, чем их готовность заменить живых ведущих.