OpenAI lanza la extensión Codex para Chrome: funciona con el navegador directamente en Windows y macOS

OpenAI lanza la extensión Codex para Chrome: funciona con el navegador directamente en Windows y macOS — Factivera

OpenAI ha integrado Codex con Chrome a través de una extensión nativa para macOS y Windows. El agente de IA realiza automatizaciones del navegador, gestión de pestañas e interacción con aplicaciones web a través de sesiones activas de usuario sin tomar el control total.

La corporación OpenAI ha presentado la extensión Codex para el navegador Chrome, que funciona bajo los sistemas operativos Windows y macOS. Esta solución permite que el modelo lingüístico actúe como un agente capaz de interactuar directamente con la estructura DOM de páginas web, enviar eventos de clic y entrada, y leer datos de aplicaciones web protegidas a través de sesiones de usuario ya autenticadas. A diferencia de las herramientas RPA clásicas, Codex no requiere una emulación completa del navegador: funciona sobre una instancia real de Chrome.

La arquitectura de la extensión admite el trabajo paralelo con grupos de pestañas. Codex puede procesar tareas de un solo hilo dentro de un grupo dedicado de pestañas de Chrome, manteniendo el contexto de navegación. Técnicamente, se han implementado escenarios de cumplimentación de formularios de varios pasos, verificación de paneles de control y depuración de scripts de JavaScript directamente en la consola del navegador. La extensión también funciona en segundo plano sin bloquear la interfaz de usuario.

La instalación requiere descargar el plugin Codex desde Chrome Web Store y confirmar los permisos para leer datos de las páginas y gestionar pestañas. Luego, en la aplicación de escritorio Codex, en la sección «Plugins», se vincula la extensión. Al crear un nuevo hilo, el servicio selecciona automáticamente la herramienta: usa Chrome para sitios con autenticación de usuario (por ejemplo, Salesforce, Gmail) y el navegador integrado de la aplicación para localhost y archivos locales. La invocación directa del navegador es posible mediante el comando «@Chrome».

La extensión se suscribe a los eventos de las API chrome.debugger y chrome.tabs, obteniendo acceso directo a los flujos de CDP (Chrome DevTools Protocol). A través de una conexión WebSocket entre la extensión y el servidor local de la aplicación de escritorio Codex, se transmiten comandos serializados. El modelo de OpenAI genera una secuencia de acciones (localizadores XPath, entrada, clics) que la extensión ejecuta dentro de la pestaña seleccionada. Las cookies de sesión y el localStorage se conservan, lo que garantiza el funcionamiento con la autenticación existente. Los grupos de pestañas se vinculan al identificador del hilo mediante chrome.tabGroups, lo que permite al agente aislar contextos de diferentes tareas.

La diferencia clave con soluciones anteriores es la ausencia de necesidad de un navegador headless o un servidor proxy. Esto reduce la detección como bot por parte de sistemas anti-bot (Cloudflare, reCAPTCHA v3), ya que todos los eventos se emulan desde un perfil de usuario real de Chrome. Sin embargo, esto aumenta los riesgos de filtración de datos a través de la extensión, que tiene acceso a todas las pestañas activas. El precio de acceso a Codex a través de la API es de 20 dólares por cada mil sesiones, dependiendo de la región.