OpenAI представила Operator — новый ИИ-агент для ChatGPT, способный выполнять действия в интернете вместо пользователя

Американская научно-исследовательская организация OpenAI представила новую функцию для ChatGPT под названием Operator. Это ИИ-агент, который может автономно выполнять действие в интернете от имени пользователя.
Operator основан на новой модели, называемой Computer-Using Agent (CUA). Объединяя визуальные возможности GPT-4o с расширенными навыками рассуждения через обучение с подкреплением, CUA обучена взаимодействию с графическими пользовательскими интерфейсами (GUI) — кнопками, меню и текстовыми полями, которые люди видят на экране.
Operator может видеть (через скриншоты) и взаимодействовать (используя все действия, доступные мыши и клавиатуре) с браузером, что позволяет ему выполнять действия в интернете без необходимости использования пользовательских API-интеграций.
Вот некоторые из фишек, которые поддерживает Operator:
- Заказ ингредиентов для блюда на основе фотографий и рецепта;
- Планирование поездок на основе бюджета и интересов пользователя, а также информации с форума Reddit;
- Изучение вопроса инвестирования в криптовалюты на основе токенов, которые могут стать популярными в будущем;
- Бронирование рейсов и номеров на Booking;
- Планирование встреч с парикмахером на основе расписания в Google Calendar;
- Поиск подарка для мамы, жены или другого близкого человека;
- Заказ уборки на дом через интеграцию с сервисом Thumbtack;
- Поиск выгодного медицинского страхования;
- Поиск различных услуг. К примеру, можно найти человека, занимающегося выгулом собак в различных странах.
Примечательно, что функция может отказаться выполнять те или иные действия, которые могут нанести вред и несут потенциальную угрозу. Operator поддерживает практически все сайты протокола HTTPS, а также некоторые сервисы и приложения.
Во время использования функции Operator запускает шифрованный браузер в облаке. При желании пользователь может перехватить управление и скорректировать задачу. В некоторых ситуациях, таких как покупка на сайтах, пользователь должен подтвердить запрос.
В США владельцы премиального плана ChatGPT Pro (стоит $200 в месяц) уже получили ранний доступ к Operator. В ближайшем будущем OpenAI планирует расширить поддержку для планов Plus, Team и Enterprise. В ЕС функция пока недоступна.
Напомним, ранее мы сообщали о новой ИИ-функции для форума Reddit.
-
Экс-сотрудник OpenAI, обвинивший компанию в нарушении авторских прав, найден мёртвым
-
Всё ради выгоды: Microsoft и OpenAI определили, какой ИИ считать самообучающимся
-
Китайский ИИ DeepSeek попал под подозрением Microsoft и OpenAI из-за возможного обучения на ChatGPT
-
Вышла новая мощная модель ChatGPT с бесплатной версией — o3-mini
-
Сестра главы OpenAI Сэма Альтмана обвинила брата в сексуализированном насилии