OpenAI представили агента під назвою – «Оператор»
24 января 2025 г.
OpenAI анонсували запуск ІІ-агента «Оператор» для автоматизації онлайн-завдань. Він уміє переглядати веб-сторінки, вводити текст, натискати кнопки та заповнювати форми. «Оператор» спрощує рутинні дії, такі як бронювання, покупки та подання заявок, заощаджуючи час і роблячи роботу з цифровими сервісами зручнішою.
Як працює «Оператор»?
В основі агента лежить нова модель Computer-Using Agent (CUA), що поєднує можливості GPT-4o з розширеним логічним мисленням. Агент сприймає інформацію через скриншоти, аналізуючи візуальні дані з екрана. Він використовує мишку та клавіатуру подібно до того, як це робить людина, імітуючи реальні дії користувача. Крім того, він навчений запитувати підтвердження перед виконанням критично важливих дій, таких як бронювання готелю чи надсилання листа, що забезпечує додатковий рівень контролю та безпеки.
Хто отримає доступ до тестування?
OpenAI представили дослідницьку версію ІІ-агента для підписників ChatGPT Pro у США за $200. Він працює на окремій платформі й буде вдосконалюватися на основі відгуків. Поки що «Оператор» не завжди справляється ідеально й інколи потребує ручного втручання. Однак ця розробка відкриває нові можливості для автоматизації та спрощує взаємодію з ІІ.
Конкуренція на ринку
OpenAI – не єдина компанія, що працює над подібними технологіями. У жовтні 2024 року стартап Anthropic представив оновлену версію ШІ-моделі Claude 3.5 Sonnet, яка також уміє взаємодіяти з комп’ютером, керувати курсором, натискати кнопки та вводити текст.