Hitech logo

Тренды

В Google ответили на GPT-4o: новая Gemini разговаривает как человек

TODO:
Дарина Житова14 мая, 14:41

После того, как OpenAI представила миру GPT-4o, Google не осталась в стороне и показала видео с обновленной версией Gemini. В ролике Gemini, работающая на смартфоне Pixel, продемонстрировала выдающиеся способности и в разговоре была очень похожа на человека. Впрочем, некоторые эксперты настроены скептически: Google уже ловили на подделке видео-представлений новых продуктов и преувеличении возможностей своей нейросети.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Ролик получился у Гугл небольшой и достаточно простой — камера фиксирует сцену подготовки к конференции Google I/O, а ИИ-помощник в смартфоне Pixel сообщает, что это похоже на подготовку крупного события. Когда на экране появился логотип конференции, модель поняла, что они относятся к Google I/O и предоставила краткое описание предстоящего мероприятия.

Видео впечатляет естественностью беседы между человеком и ИИ, что напоминает последнюю демонстрацию ChatGPT от OpenAI. Можно даже забыть, что за голосом, исходящим из устройства Pixel, нет настоящего человека — так естественно складывается разговор.

Без непосредственного тестирования этих двух моделей ИИ трудно сказать, какая из них работает лучше, но обе производят сильное впечатление. Эксперты говорят, что последние демонстрации дают основания ожидать будущее искусственного интеллекта с восторгом и некоторой тревогой. Однако они призывают подождать внедрения новой Gemini от Google: компания ранее подвергалась критике за то, что в демонстрациях ее ИИ-продукты выглядели более впечатляющими, чем на самом деле.

Пользователям предстоит лично оценить изменения в Gemini, чтобы убедиться в их значимости, но если верить видео, битва ИИ только начинается. Предстоящее выступление разработчиков на Google I/O, как ожидается, раскроет планы развития Gemini и других ИИ-проектов компании.

Напомним, что OpenAI только что обновила свою языковую модель, лежащую в основе чат-бота ChatGPT, до версии GPT-4o. Эта модель работает значительно быстрее предыдущей — время ответа сократилось с 2-3 секунд до 320 миллисекунд. Кроме того, GPT-4o обладает улучшенными возможностями работы с текстом, изображениями и звуком. Новая модель может служить голосовым помощником, внимательно наблюдая за окружающим миром и реагируя на него почти как ИИ-персонаж фильма «Она».

По сообщениям, GPT-4o может имитировать человеческие эмоции, смеяться над шутками и вести диалог очень естественно. Новая модель будет доступна бесплатно, хотя платные подписчики смогут отправлять запросы в пять раз чаще. Сам Альтман описал модель как «мультимодальную изначально», что означает её способность генерировать и понимать контент в различных форматах: текст, звук, изображения.