В ролике изображены фотореалистичные люди, которые едят, готовят и доставляют пиццу пепперони. В нем даже есть диалоги и фоновая музыка. Однако мимика и мертвые глаза героев ролика выдают его происхождение. Все люди выглядят как жители «зловещей долины», и эффект усиливается бессвязным сценарием. Иногда кажется, что объекты сливаются друг с другом. Очевидно, что качество вывода оставляет желать лучшего. Но эти технологии могут усовершенствоваться очень быстро, и фотореалистичные видеоизображения станут намного убедительнее.
Pizza Later рассказали, что они использовали пять разных моделей ИИ для создания различных материалов для видео, а затем склеили вместе видео, диалоги, музыку и некоторые пользовательские изображения в Adobe After Effects. На выполнение проекта ушло три часа.
Разработчики рассказали, что идея рекламы пришла им в голову после того, как они получили доступ к Runway Gen-2 — модели преобразования текста в видео, которая находится в закрытой бета-версии. Runway Gen-2 создает видеоролики на основе уже существующих материалов.
Pizza Later также использовали GPT-4, движок для ChatGPT и Bing Chat, чтобы придумать название для вымышленной пиццерии (Pepperoni Hug Spot) и написать сценарий. Затем разработчики использовали ElevenLabs Prime Voice AI, чтобы обеспечить реалистичное повествование мужским голосом. С помощью MidJourney были созданы изображения, которые появляются в видео, включая внешний вид ресторана и пиццы. ИИ-инструмент Soundraw использовался для создания фоновой музыки.
Энтузиасты рассказали, что их первоначальная идея для видео звучала так: «счастливый мужчина, женщина, семья, поедающие кусок пиццы в ресторане, телевизионная реклама».
Большинство инструментов, которые используют Pizza Later, платные, но предлагают бесплатную пробную версию. Нельзя сказать, что видео полностью создал искусственный интеллект, поскольку разработчикам приходилось сшивать конечные результаты в общее повествование. Возможно, в ближайшем будущем такой мультимодельный инструмент, как Microsoft Jarvis, сможет выполнять все эти задачи через единый чат-бот и итоговые результаты будут менее пугающими.