
OpenAI ha presentado un nuevo agente de inteligencia artificial (IA) denominado Operator, diseñado para llevar a cabo diversas tareas en línea en nombre de los usuarios. Según la startup, «utilizando su propio navegador, puede examinar una página web e interactuar con ella mediante escritura, clics y desplazamiento».
Operator se posiciona como uno de los primeros asistentes de IA de la compañía, enfocado en la ejecución autónoma de múltiples tareas. Este asistente está diseñado para automatizar actividades repetitivas en cualquier navegador, siendo capaz de completar formularios, realizar pedidos de comestibles, gestionar reservas de servicios o programar reuniones virtuales con una sola instrucción.
El recurso se encuentra disponible en una “versión preliminar de investigación”, lo que implica ciertas limitaciones en su funcionalidad y capacidad de procesamiento. La organización, liderada por Sam Altman, asegura que su producto evolucionará “en función de los comentarios» recibidos.
Transformación de la IA en un recurso activo
“Operator convierte a la IA de una herramienta pasiva en un recurso activo dentro del ecosistema digital. Su habilidad para utilizar las mismas interfaces que los humanos emplean diariamente amplía la utilidad de la IA, ayudando a las personas a ahorrar tiempo en sus tareas cotidianas”, afirma OpenAI.
El asistente busca establecerse como un aliado tanto en el sector público como en el privado. La compañía colabora con empresas como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber para atender las necesidades de los clientes finales, “respetando las normativas establecidas”. Además, se encuentra explorando “a fondo” casos de uso con las autoridades de la ciudad de Stockton, California, con el objetivo de optimizar los procesos administrativos.
Funcionamiento del modelo de IA
El funcionamiento de Operator se basa en el modelo de IA Computer-Using Agent (CUA), que combina las capacidades de visión y razonamiento de GPT-4 mediante una técnica de aprendizaje por refuerzo. Esto permite que CUA interactúe con botones, menús y campos de texto visibles en una pantalla, sin necesidad de integrar API personalizadas.
Los desarrolladores destacan que el asistente utiliza “sus capacidades de razonamiento para autocorregirse”. En caso de no poder completar una tarea, devuelve el control al usuario, garantizando así una experiencia fluida y colaborativa. El sistema está diseñado para proteger la información confidencial, evitando compartir credenciales o datos sensibles con los sitios web. OpenAI enfatiza que Operator “rechaza solicitudes dañinas y bloquea contenido no permitido”.
Disponibilidad y acceso al servicio
Los interesados en utilizar Operator solo necesitan acceder al portal ‘operator.chatgpt.com’ y describir la tarea que desean realizar. En cualquier momento, pueden retomar el control del navegador remoto. Recibirán alertas proactivas cuando se requieran acciones específicas que involucren información sensible, como contraseñas y datos para procesar pagos. El programa permite establecer instrucciones específicas para sitios web concretos.
Por el momento, la nueva IA está disponible únicamente para los suscriptores del plan ChatGPT Pro en Estados Unidos. OpenAI tiene planes de ampliar su disponibilidad a usuarios en otros países y ofrecerlo en sus membresías Plus, Team y Enterprise en el futuro.