OpenAI, Chrome용 확장 프로그램 Codex 출시 – Windows 및 macOS에서 브라우저 직접 제어

OpenAI, Chrome용 확장 프로그램 Codex 출시 – Windows 및 macOS에서 브라우저 직접 제어 — Factivera

OpenAI는 macOS 및 Windows용 네이티브 확장 프로그램을 통해 Codex를 Chrome에 통합했습니다. AI 에이전트는 완전한 제어 권한을 넘겨받지 않고 활성 사용자 세션을 통해 브라우저 자동화, 탭 관리, 웹 애플리케이션 상호작용을 수행합니다.

OpenAI가 Windows 및 macOS 운영 체제에서 작동하는 Chrome 브라우저용 확장 프로그램 Codex를 발표했습니다. 이 솔루션을 통해 언어 모델은 에이전트 역할을 수행하여 웹 페이지의 DOM 구조와 직접 상호작용하고, 클릭 및 입력 이벤트를 전송하며, 이미 인증된 사용자 세션을 통해 보호된 웹 애플리케이션에서 데이터를 읽어올 수 있습니다. 기존 RPA 도구와 달리 Codex는 브라우저의 완전한 에뮬레이션이 필요하지 않으며, 실제 Chrome 인스턴스 위에서 작동합니다.

확장 프로그램의 아키텍처는 탭 그룹의 병렬 처리를 지원합니다. Codex는 Chrome의 지정된 탭 그룹 내에서 단일 스레드의 작업을 처리하면서 탐색 컨텍스트를 유지할 수 있습니다. 기술적으로 다단계 폼 작성, 대시보드 확인, 브라우저 콘솔에서의 JavaScript 스크립트 디버깅 시나리오가 구현되어 있습니다. 또한 확장 프로그램은 사용자 인터페이스를 차단하지 않고 백그라운드에서도 작동합니다.

설치하려면 Chrome 웹 스토어에서 Codex 플러그인을 다운로드하고 페이지 데이터 읽기 및 탭 관리 권한을 승인해야 합니다. 그런 다음 데스크톱 애플리케이션 Codex의 ‘플러그인’ 섹션에서 확장 프로그램을 연결합니다. 새 스레드 생성 시 서비스는 자동으로 도구를 선택합니다. 사용자 인증이 필요한 사이트(예: Salesforce, Gmail)에는 Chrome을 사용하고, localhost 및 로컬 파일에는 애플리케이션 내장 브라우저를 사용합니다. 브라우저 직접 호출은 ‘@Chrome’ 명령으로 가능합니다.

확장 프로그램은 chrome.debugger 및 chrome.tabs API 이벤트를 구독하여 CDP(Chrome DevTools Protocol) 스트림에 직접 접근합니다. 확장 프로그램과 데스크톱 애플리케이션 Codex의 로컬 서버 간 WebSocket 연결을 통해 직렬화된 명령이 전송됩니다. OpenAI 모델은 일련의 동작(XPath 로케이터, 입력, 클릭)을 생성하고, 확장 프로그램이 선택된 탭 내에서 이를 실행합니다. 세션 쿠키와 localStorage는 유지되어 기존 인증 상태에서의 작동을 보장합니다. 탭 그룹은 chrome.tabGroups를 통해 스레드 ID에 바인딩되어 에이전트가 서로 다른 작업 컨텍스트를 격리할 수 있도록 합니다.

이전 솔루션과의 핵심 차이점은 헤드리스 브라우저나 프록시 서버가 필요 없다는 것입니다. 이는 모든 이벤트가 실제 사용자 프로필의 Chrome에서 에뮬레이트되므로 Cloudflare, reCAPTCHA v3과 같은 안티봇 시스템이 봇으로 탐지하는 것을 줄여줍니다. 그러나 활성화된 모든 탭에 접근할 수 있는 확장 프로그램을 통한 데이터 유출 위험이 높아집니다. API를 통한 Codex 접근 비용은 지역에 따라 세션 1,000회당 20달러부터 시작합니다.