GPT-5.3-Codex / CLI v0.125.0
OpenAI Codex, 쓰기 전
요금 구조 확인해야 합니다
2026년 4월 2일, Codex 요금이 조용히 바뀌었습니다. 메시지당 과금에서 토큰당 과금으로. 사용 패턴에 따라 실제 크레딧 소비가 예상보다 훨씬 많이 나올 수 있는 구조입니다.
4월 16일 대규모 업데이트, 실제로 뭐가 달라졌나
OpenAI가 2026년 4월 16일 Codex를 대규모 업데이트했습니다. 공식 릴리스 노트에 딱 이렇게 나옵니다. “코딩 도구를 넘어 소프트웨어 개발 전체 워크플로를 다루는 파트너”로 자리잡겠다는 방향입니다. 이번 업데이트에서 실질적으로 쓸 수 있게 된 기능은 다섯 가지입니다.
- 백그라운드 컴퓨터 사용(Computer Use) — Codex가 자체 커서로 Mac 앱을 직접 조작합니다. 클릭, 타이핑, 화면 인식이 모두 됩니다. API를 제공하지 않는 앱도 작업이 가능해졌습니다. (출처: openai.com/index/codex-for-almost-everything, 2026.04.16)
- 인앱 브라우저 — Atlas 기반의 브라우저가 앱 안에 내장됩니다. localhost에서 돌아가는 프런트엔드를 직접 열어보면서 에이전트가 UI 버그를 검증할 수 있습니다.
- 이미지 생성 — gpt-image-1.5 모델을 통해 목업, 와이어프레임, 게임 비주얼을 같은 워크스페이스 안에서 뽑아낼 수 있습니다.
- 메모리 — 이전 대화에서 쌓인 코딩 스타일, 프로젝트 컨벤션, 수정 패턴을 기억합니다. 처음 설명하는 시간이 크게 줄어듭니다.
- 90개 이상 신규 플러그인 — Atlassian Rovo, CircleCI, GitLab, Neon by Databricks, Remotion, Render 등이 추가됐습니다. Codex가 접근할 수 있는 컨텍스트 범위가 개발 전 스택으로 확장된 셈입니다.
4월 23일에는 GPT-5.5가 Codex에 추가됐습니다. 현재 모델 선택기에서 GPT-5.5를 선택할 수 있으며, CLI에서는 codex --model gpt-5.5 명령어로 바로 실행됩니다.
요금 구조가 바뀐 방식 — 메시지에서 토큰으로
많은 사람들이 “Codex는 ChatGPT Plus에 포함돼 있으니까 무료”라고 생각합니다. 그런데 실제로는 크레딧 기반으로 사용량이 제한됩니다. 그리고 2026년 4월 2일부터 그 크레딧이 소진되는 방식이 바뀌었습니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
이전 방식: 메시지 1건당 고정 크레딧 소비 (예: GPT-5.3-Codex 로컬 작업 1건 = 약 5크레딧). 이것만 보면 단순해 보였습니다. 바뀐 방식: 실제로 소비한 입력 토큰, 캐시된 입력 토큰, 출력 토큰을 각각 따로 계산합니다. 긴 컨텍스트를 많이 넣으면 같은 작업도 크레딧이 훨씬 더 나갑니다.
OpenAI 공식 요율 문서에 이 구조가 명시돼 있습니다. (출처: help.openai.com/en/articles/20001106-codex-rate-card, 2026.04.02 갱신) 핵심은 출력 토큰 단가가 입력 토큰 단가의 8배라는 점입니다. 코드 생성처럼 출력이 긴 작업은 예상보다 빠르게 크레딧이 소진됩니다. 캐시된 입력을 활용하면 단가가 1/10로 내려가므로, 동일한 프로젝트 컨텍스트를 반복적으로 넘기는 자동화 작업에서는 캐시 활용이 핵심입니다.
Business·Enterprise 신규 플랜은 4월 2일부터 토큰 기반으로 전환됐고, Plus·Pro 플랜도 이미 이 방식이 적용돼 있습니다. 소수의 구형 Enterprise 고객만 레거시 요율을 유지 중이며 이들도 순차적으로 전환될 예정입니다.
모델별 크레딧 요율, 같은 작업이어도 8배 차이 납니다
공식 레이트 카드(2026.04.02 기준)를 직접 뽑아봤습니다. 모델 선택에 따라 크레딧 소비량이 얼마나 달라지는지 아래 표로 확인할 수 있습니다.
| 모델 | 입력 (1M 토큰당) |
캐시 입력 (1M 토큰당) |
출력 (1M 토큰당) |
|---|---|---|---|
| GPT-5.5 | 125 크레딧 | 12.5 크레딧 | 750 크레딧 |
| GPT-5.4 | 62.5 크레딧 | 6.25 크레딧 | 375 크레딧 |
| GPT-5.3-Codex (코드리뷰 기본 모델) |
43.75 크레딧 | 4.375 크레딧 | 350 크레딧 |
| GPT-5.4-Mini | 18.75 크레딧 | 1.875 크레딧 | 113 크레딧 |
출처: OpenAI Codex 공식 레이트 카드 (help.openai.com/en/articles/20001106-codex-rate-card, 2026.04.02 갱신)
📊 직접 계산해보면 이렇게 됩니다
1만 토큰 출력 기준으로 GPT-5.5 모델을 사용하면 7.5 크레딧이 소비됩니다. 같은 작업을 GPT-5.4-Mini로 처리하면 1.13 크레딧. 약 6.6배 차이입니다. 코드 생성 작업처럼 긴 출력이 반복되는 환경에서는 모델 선택 하나가 월 예산을 크게 바꿉니다.
Fast 모드를 켜면 지원되는 모델에서 크레딧이 추가 소진됩니다. Codex CLI 0.124.0부터 자격 있는 ChatGPT 플랜은 Fast 모드가 기본 적용됩니다. 설정에서 명시적으로 끄지 않으면 자동으로 더 빠른 대신 더 많은 크레딧을 씁니다. (출처: developers.openai.com/codex/changelog, 2026.04.23)
코딩 에이전트 순위에서 Codex가 2위인 이유
OpenAI Codex는 현재 코딩 AI 에이전트 비교에서 1위가 아닙니다. MightyBot이 2026년 4월 기준으로 정리한 순위에서 Codex는 2위입니다. 1위는 Claude Code(Anthropic)입니다. GPT 진영의 에이전트가 Claude에 밀린다는 점이 아직 많은 글에 반영되지 않고 있습니다.
📋 2026년 4월 기준 코딩 에이전트 주요 지표 비교
| 에이전트 | SWE-bench Verified |
주요 특징 |
|---|---|---|
| Claude Code | 87.6% | 터미널 기반, 전체 코드베이스 읽기, SWE-bench Pro 1위 |
| OpenAI Codex | 85.0% | 클라우드 기반, 컴퓨터 사용, 멀티 에이전트 병렬 실행 |
| Gemini CLI | 78.0% | 1M 토큰 컨텍스트, 무료 사용 가능 |
출처: MightyBot 코딩 에이전트 순위, 2026년 4월 기준 (mightybot.ai/blog/coding-ai-agents-for-accelerating-engineering-workflows)
GPT-5.3-Codex 기준 SWE-bench Verified 점수가 85.0%이고, Claude Opus 4.7은 87.6%입니다. 2.6%p 차이지만, 이 차이가 실제 복잡한 리팩토링 작업에서는 체감될 수 있습니다. Codex의 강점은 SWE-bench 점수가 아니라 클라우드 기반 멀티 에이전트 병렬 실행과 백그라운드 자동화에 있습니다. 내가 다른 일을 하는 동안 여러 에이전트가 동시에 돌아가면서 결과를 큐에 쌓아두는 방식입니다.
CLI만 비교하면 Claude Code가 더 강하고, 클라우드 자동화와 데스크톱 컨트롤을 함께 쓴다면 Codex가 현재 가장 광범위한 인터페이스를 제공합니다. 이 차이를 모르고 “OpenAI니까 최고”라고 가정하면 실제 작업에서 기대와 다른 결과를 받을 수 있습니다.
깔끔해 보이는 샌드박스, 실제로 뚫린 적 있습니다
Codex는 샌드박스 환경에서 격리돼 실행된다고 소개됩니다. 맞는 말입니다. 그런데 2025년 말, 보안 연구팀 BeyondTrust Phantom Labs가 이 샌드박스를 우회해 GitHub OAuth 토큰을 실제로 탈취하는 데 성공했습니다. (출처: SecurityWeek, 2026년 보도)
⚠️ 취약점 구조 요약
- GitHub 브랜치 이름에 임의 명령어를 주입하는 방식으로 에이전트 컨테이너 내부를 실행
- Unicode 문자를 이용해 UI에는 보이지 않게 악성 페이로드 삽입
- 탈취한 토큰으로 같은 리포지토리를 사용하는 여러 조직에 횡이동 가능
- 자동화 스크립트를 동반하면 토큰 유효 시간 내에 다수 계정 접근 가능
OpenAI는 2025년 12월 BeyondTrust의 책임 공개를 받고 신속히 패치했습니다. 현재 이 취약점은 막혀 있습니다. 하지만 연구팀의 결론이 중요합니다. “AI 코딩 에이전트는 단순한 생산성 도구가 아니다. 민감한 자격증명과 조직 리소스에 접근하는 라이브 실행 환경이다.”
실사용 환경에서는 Codex에 연결하는 GitHub 토큰의 권한 범위를 최소화하고, 불필요한 리포지토리 접근을 끊어두는 것이 좋습니다. Codex CLI의 Landlock 샌드박스에서 발견된 별도 취약점(AIKIDO-2026-10070)도 있습니다. 민감한 경로(.git 등)에 대한 읽기 전용 마운트가 Landlock 규칙 적용 전에 설정되지 않는 문제로, 현재 낮은 심각도로 분류돼 있지만 CLI 업데이트를 항상 최신 버전으로 유지하는 게 기본입니다.
엔터프라이즈 확장, 어디까지 진행됐나
OpenAI가 2026년 4월 21일 공식 발표한 내용에 따르면 Codex 주간 활성 개발자 수가 400만 명을 넘어섰습니다. 불과 2주 전에 300만 명을 발표했으니, 2주 만에 100만 명이 추가된 셈입니다. (출처: openai.com/index/scaling-codex-to-enterprises-worldwide, 2026.04.21)
개인 사용자 증가보다 주목할 부분은 기업 적용 사례입니다. Virgin Atlantic은 테스트 커버리지 확대와 기술 부채 감소에, Ramp는 코드 리뷰 속도 향상에, Notion은 신기능 빌드 속도에, Cisco는 대형 연결 리포지토리 이해와 추론에 활용 중입니다.
🏢 Codex Labs + GSI
Claw에게 맡기세요
75% 할인
대화

댓글 남기기