Hitech logo

Кейсы

Новый ИИ-инструмент от OpenAI выполняет онлайн-задачи вместо пользователя

TODO:
Екатерина Шемякинская24 января, 15:56

Генеральный директор OpenAI Сэм Альтман не так давно заявил, что 2025 год станет важным годом для ИИ-агентов — инструментов, которые выполняют действия от имени пользователя. Теперь OpenAI сделала шаг в этом направлении. Компания представила ИИ-агента Operator, способного автономно работать в браузере и автоматизировать задачи — от онлайн-шопинга до бронирования путешествий. Однако модель ограничена в количестве запросов, требует контроля в некоторых ситуациях и может не распознать CAPTCHA. Operator будет доступен пользователям ChatGPT Pro в США с последующим расширением на тарифные планы Plus, Team и Enterprise.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

Operator автоматизирует такие действия, как бронирование отелей, заказ столиков в ресторанах и онлайн-шопинг. В интерфейсе есть несколько категорий задач, включая покупки, доставку, рестораны и путешествия, каждая из которых предлагает разные возможности. Когда пользователи ChatGPT включают Operator, появляется небольшое окно с отдельным веб-браузером, который используется для выполнения задач. Там же приводятся описания действий, которые выполняет агент. Пользователи могут продолжать управлять своим экраном, пока ИИ работает, так как он использует собственный браузер.

Operator основан на модели Computer-Using Agent (CUA), которая сочетает функции компьютерного зрения GPT-4o и логический вывод, реализованный в более продвинутых моделях OpenAI. Модель CUA обучена взаимодействию с пользовательским интерфейсом сайтов, что исключает необходимость использования API при доступе к различным сервисам. Иными словами, агент способен использовать кнопки, осуществлять навигацию по меню и заполнять веб-формы, действуя как человек.

OpenAI сотрудничает с DoorDash, eBay, Instacart, Priceline, StubHub и Uber для гарантии того, что Operator соблюдает условия обслуживания этих компаний.

Для предотвращения нежелательных действий, модель обучена запрашивать подтверждение пользователя перед любыми операциями, имеющими внешние последствия, например, перед отправкой заказа или электронного письма.

У Operator есть ограничения по количеству запросов, как ежедневные, так и зависящие от задачи. Агент может выполнять несколько поручений одновременно, но с разной скоростью. Для таких операций, как банковские транзакции и работа с электронной почтой, требуется контроль со стороны пользователя, например, для ввода данных карты или контроля отправки писем. Еще Operator может «застрять» на сложных интерфейсах, полях для ввода пароля или CAPTCHA. В таких случаях он попросит человека продолжить выполнение задачи.

Предоставление ИИ возможности действовать в интернете сопряжено с рисками. Злоумышленники могут использовать его для фишинга, DDoS-атак или автоматической скупки билетов. Осознавая это, OpenAI уделяет особое внимание безопасности Operator. Текущая предварительная версия использует специальные инструменты для защиты от вредоносных запросов, скрытых команд и попыток обмана. Система мониторинга приостанавливает работу при обнаружении подозрительной активности, а автоматизированные и ручные проверки постоянно совершенствуют защиту.

OpenAI гарантирует, что Operator не собирает и не сохраняет пользовательские данные.

Предварительный просмотр исследования доступен на сайте Operator.chatgpt.com, но OpenAI хочет в ближайшее время интегрировать Operator во все свои продукты. Ранее компания представила функцию Tasks, наделив ChatGPT простыми функциями автоматизации, включая напоминания и подсказки.