OpenAI lança extensão Codex para Chrome – operação direta com o navegador no Windows e macOS

OpenAI lança extensão Codex para Chrome – operação direta com o navegador no Windows e macOS — Factivera

A OpenAI integrou o Codex ao Chrome por meio de uma extensão nativa para macOS e Windows. O agente de IA realiza automações no navegador, gerenciamento de abas e interação com aplicações web por meio de sessões ativas do usuário sem assumir o controle total.

A corporação OpenAI apresentou a extensão Codex para o navegador Chrome, que funciona sob os sistemas operacionais Windows e macOS. Esta solução permite que o modelo de linguagem atue como um agente capaz de interagir diretamente com a estrutura DOM de páginas web, enviar eventos de clique e digitação, e ler dados de aplicações web protegidas através de sessões de usuário já autenticadas. Diferentemente das ferramentas RPA clássicas, o Codex não requer emulação completa do navegador – ele opera sobre uma instância real do Chrome.

A arquitetura da extensão suporta trabalho paralelo com grupos de abas. O Codex pode processar tarefas de uma única thread dentro de um grupo dedicado de abas do Chrome, mantendo o contexto de navegação. Tecnicamente, foram implementados cenários de preenchimento de formulários de múltiplas etapas, verificação de dashboards e depuração de scripts JavaScript diretamente no console do navegador. A extensão também funciona em segundo plano sem bloquear a interface do usuário.

A instalação requer o download do plugin Codex da Chrome Web Store e a confirmação das permissões para ler dados das páginas e gerenciar abas. Em seguida, no aplicativo desktop Codex, na seção «Plugins», a extensão é vinculada. Ao criar uma nova thread, o serviço seleciona automaticamente a ferramenta: usa o Chrome para sites com autenticação de usuário (por exemplo, Salesforce, Gmail) e o navegador embutido do aplicativo para localhost e arquivos locais. A chamada direta ao navegador é possível pelo comando «@Chrome».

A extensão assina os eventos das APIs chrome.debugger e chrome.tabs, obtendo acesso direto aos fluxos do CDP (Chrome DevTools Protocol). Através de uma conexão WebSocket entre a extensão e o servidor local do aplicativo desktop Codex, comandos serializados são transmitidos. O modelo da OpenAI gera uma sequência de ações (localizadores XPath, digitação, cliques) que a extensão executa dentro da aba selecionada. Os cookies de sessão e o localStorage são preservados, garantindo o funcionamento com a autenticação existente. Grupos de abas são vinculados ao identificador da thread através do chrome.tabGroups, permitindo que o agente isole contextos de diferentes tarefas.

A principal diferença em relação às soluções anteriores é a ausência de necessidade de um navegador headless ou servidor proxy. Isso reduz a detecção como bot por sistemas anti-bot (Cloudflare, reCAPTCHA v3), uma vez que todos os eventos são emulados a partir de um perfil real de usuário do Chrome. No entanto, isso aumenta os riscos de vazamento de dados através da extensão, que tem acesso a todas as abas ativas. O preço de acesso ao Codex via API é de US$ 20 por mil sessões, dependendo da região.