Американская научно-исследовательская организация OpenAI представила новую функцию для ChatGPT под названием Operator. Это ИИ-агент, который может автономно выполнять действие в интернете от имени пользователя.
Operator основан на новой модели, называемой Computer-Using Agent (CUA). Объединяя визуальные возможности GPT-4o с расширенными навыками рассуждения через обучение с подкреплением, CUA обучена взаимодействию с графическими пользовательскими интерфейсами (GUI) — кнопками, меню и текстовыми полями, которые люди видят на экране.
Operator может видеть (через скриншоты) и взаимодействовать (используя все действия, доступные мыши и клавиатуре) с браузером, что позволяет ему выполнять действия в интернете без необходимости использования пользовательских API-интеграций.
Вот некоторые из фишек, которые поддерживает Operator:
Примечательно, что функция может отказаться выполнять те или иные действия, которые могут нанести вред и несут потенциальную угрозу. Operator поддерживает практически все сайты протокола HTTPS, а также некоторые сервисы и приложения.
Во время использования функции Operator запускает шифрованный браузер в облаке. При желании пользователь может перехватить управление и скорректировать задачу. В некоторых ситуациях, таких как покупка на сайтах, пользователь должен подтвердить запрос.
В США владельцы премиального плана ChatGPT Pro (стоит $200 в месяц) уже получили ранний доступ к Operator. В ближайшем будущем OpenAI планирует расширить поддержку для планов Plus, Team и Enterprise. В ЕС функция пока недоступна.
Напомним, ранее мы сообщали о новой ИИ-функции для форума Reddit.
Вместо пользователя сам придумывает запросы, сам же их ищет.