
OpenAI представили агента под названием – «Оператор»
24 января 2025 г.
OpenAI анонсировали запуск ИИ-агента «Оператор» для автоматизации онлайн-задач. Он умеет просматривать веб-страницы, вводить текст, кликать по кнопкам и заполнять формы. «Оператор» упрощает рутинные действия, такие как бронирование, покупки и отправка заявок, экономя время и делая работу с цифровыми сервисами удобнее.
Как «Оператор» работает?
В основе агента лежит новая модель Computer-Using Agent (CUA), которая сочетает возможности GPT-4o с расширенным логическим мышлением. Агент воспринимает информацию через скриншоты, анализируя визуальные данные с экрана. Он использует мышь и клавиатуру аналогично тому, как это делает человек, имитируя реальные действия пользователя. Кроме того, он обучен запрашивать подтверждение перед выполнением критически важных действий, таких как бронирование отеля или отправка письма, что обеспечивает дополнительный уровень контроля и безопасности.
Кто получит доступ к тестированию?
OpenAI представила исследовательскую версию ИИ-агента для подписчиков ChatGPT Pro в США за $200. Он работает на отдельной платформе и будет улучшаться на основе отзывов. Пока «Оператор» не всегда справляется идеально, и иногда требует ручного вмешательства. Однако эта разработка открывает новые возможности для автоматизации и упрощает взаимодействие с ИИ.
Конкуренция на рынке
OpenAI не единственная компания, работающая над подобными технологиями. В октябре 2024 года стартап Anthropic представил обновленную версию ИИ-модели Claude 3.5 Sonnet, которая также умеет взаимодействовать с компьютером, управлять курсором, нажимать кнопки и вводить текст.