OpenAI Codex 토큰 요금, 쓴 만큼 더 나오는 조건
2026년 4월 2일, OpenAI가 Codex 과금 방식을 조용히 바꿨습니다.
메시지 단위에서 API 토큰 소비량 기반으로 전환한 것인데,
이게 전 플랜에 동시 적용된다고 오해하면 비용 계산이 완전히 틀려집니다.
어떤 플랜이 바뀌었는지, 그리고 실제 비용이 오르는 조건이 무엇인지 직접 확인했습니다.
Fast mode = 크레딧 2배 소비
Plus·Pro는 아직 메시지 기반
캐시 입력은 일반 입력의 1/10
실제로 바뀐 게 뭔지부터 — 플랜별 적용 차이
2026년 4월 2일부터 OpenAI Codex 요금이 메시지당 크레딧 방식에서 API 토큰 소비량 기반으로 전환됐습니다. 그런데 가장 많이 오해하는 부분이 있습니다. 이 전환이 모든 플랜에 동시 적용되는 게 아닙니다. (출처: OpenAI ChatGPT Business 릴리스 노트, 2026.04.02)
💡 공식 발표문과 실제 플랜 흐름을 같이 놓고 보니 이런 차이가 보였습니다
Plus·Pro 같은 개인 구독 플랜은 아직 메시지 기반입니다. Business(신규·기존) 그리고 신규 Enterprise만 토큰 기반으로 먼저 전환됐습니다. 기존 Enterprise/Edu 고객은 몇 주 안에 순차 마이그레이션 예정이고, 관리자 이메일로 별도 안내된다고 공식 문서에 나와 있습니다.
| 플랜 | 현재 과금 방식 | 전환 시점 |
|---|---|---|
| ChatGPT Free / Go | 메시지 기반 | 미정 |
| Plus / Pro | 메시지 기반 (곧 전환 예정) | 수 주 내 |
| Business (신규·기존) | 토큰 기반 ✅ 전환 완료 | 2026.04.02~ |
| 신규 Enterprise | 토큰 기반 ✅ 전환 완료 | 2026.04.02~ |
| 기존 Enterprise / Edu | 레거시(메시지 기반) 유지 | 이메일 별도 안내 |
Reddit 커뮤니티(r/codex)에서 “Plus인데 왜 한도가 이상해졌냐”는 글이 넘쳐났는데, 정작 그 대부분은 4월 2일로 종료된 2x 프로모션의 영향이었습니다. 토큰 전환과 프로모션 종료가 같은 시점에 겹쳐 혼선이 컸습니다.
새 요금표 완전 정리 — 모델별 토큰 단가
새 요금표는 100만 토큰(1M tokens)당 크레딧으로 표기됩니다. 입력 토큰, 캐시 입력 토큰, 출력 토큰을 각각 다르게 계산하는 구조입니다. 아래는 OpenAI Codex 공식 Rate Card(2026.04.02 기준)에서 그대로 가져온 수치입니다.
| 모델 | 입력 토큰 (1M당 크레딧) |
캐시 입력 (1M당 크레딧) |
출력 토큰 (1M당 크레딧) |
|---|---|---|---|
| GPT-5.4 | 62.50 | 6.250 | 375 |
| GPT-5.4-Mini | 18.75 | 1.875 | 113 |
| GPT-5.3-Codex ⭐ | 43.75 | 4.375 | 350 |
| GPT-5.1-Codex-Max | 31.25 | 3.125 | 250 |
| GPT-5.1-Codex-mini | 6.25 | 0.625 | 50 |
💡 출력 토큰이 입력의 8배라는 게 실제로 어떤 의미인지
크레딧 구매 단가는 1,000크레딧에 $40 수준입니다. GPT-5.3-Codex 기준 100만 출력 토큰에 350크레딧이 소비되고, 이를 달러로 환산하면 100만 출력 토큰당 $14 — 사실상 OpenAI API 직접 사용 요금과 동일합니다. 크레딧이라는 단위를 쓰지만 API 요금이 그대로 적용되는 셈입니다.
비용이 생각보다 빨리 는다는 게 어떤 의미인가
OpenAI가 공식 문서에서 제시하는 평균 비용은 개발자 1인당 월 $100~$200입니다. 그런데 사용 모델, 병렬 인스턴스 수, 자동화 빈도, Fast mode 여부에 따라 편차가 크다고 같은 문서에서 바로 밝히고 있습니다. (출처: developers.openai.com/codex/pricing) 이 $100~$200이 “안심 수치”처럼 읽히지만, 막상 써보면 다릅니다.
⚠️ 비용이 올라가는 조건 — 직접 계산해봤습니다
출력: 5,000 × 350 ÷ 1,000,000 = 1.75 크레딧
합계: 약 2.625 크레딧
→ 이 규모에선 레거시 요금(25크레딧/건)보다 약 10배 저렴
하지만 대규모 리팩터링(입력 200K+, 출력 50K+)이면?
출력: 50,000 × 350 ÷ 1,000,000 = 17.5 크레딧
합계: 약 26.25 크레딧
→ 레거시 요금(25크레딧/건)과 비슷하거나 초과
결론부터 말씀드리면, 작업이 작으면 구 요금보다 훨씬 저렴해지고, 작업이 클수록 오히려 역전됩니다. 단순 버그 수정처럼 짧은 작업을 많이 하는 개발자에게 유리한 구조이고, 전체 코드베이스를 대규모로 리팩터링하거나 긴 컨텍스트를 반복 주입하는 팀에게는 불리해집니다.
여기에 Fast mode를 켜면 크레딧 소비가 2배가 됩니다. (출처: OpenAI Codex Rate Card) 빠른 응답이 필요한 순간에만 켜야 하고, 습관적으로 켜놓으면 같은 작업에 돈이 두 배로 나갑니다.
캐시 입력이 비용을 낮추는 구체적 구조
토큰 기반 요금표에서 간과하기 쉬운 항목이 캐시 입력 토큰입니다. 일반 입력 토큰의 단가가 GPT-5.3-Codex 기준 43.75크레딧/1M인 반면, 캐시 입력 토큰은 4.375크레딧/1M입니다. 정확히 1/10 단가입니다. (출처: OpenAI Codex Rate Card, 2026.04.02)
💡 같은 프로젝트를 오래 할수록 단가가 내려가는 이유
동일 리포지토리에서 반복 작업하면 시스템 프롬프트와 공통 컨텍스트가 캐시에 적재됩니다. 이후 작업에서는 그 부분이 캐시 입력으로 처리되어 비용이 1/10으로 줄어듭니다. 프로젝트를 처음 시작하는 날보다 2주째에 더 저렴해지는 구조입니다.
반대로 매 요청마다 새로운 대형 컨텍스트를 주입하거나, 완전히 다른 리포지토리를 자주 바꿔가며 작업하면 캐시 적중률이 떨어져서 비용이 올라갑니다. AGENTS.md 파일이 너무 크거나, MCP 서버를 많이 연결할수록 입력 토큰이 불어난다는 것도 OpenAI 공식 문서에서 직접 언급한 내용입니다. (출처: developers.openai.com/codex/pricing)
🧮 캐시 적중 시 실제 비용 차이 계산
캐시 미적중 시: 50,000 × 43.75 ÷ 1,000,000 = 2.19 크레딧
캐시 40K 적중 시: (10K × 43.75 + 40K × 4.375) ÷ 1,000,000 = 0.61 크레딧
→ 동일 작업인데 비용이 약 72% 절감
Codex 비용 최적화 — 실제 작동하는 전략 3가지
OpenAI 공식 문서(developers.openai.com/codex/pricing)와 실사용자 커뮤니티(r/codex) 피드백을 교차 분석해 보니, 실제로 비용을 낮추는 전략이 세 가지로 수렴됩니다.
모델을 작업 성격에 따라 분리
복잡한 계획·분석에는 GPT-5.4, 실제 코드 작성에는 GPT-5.4-Mini를 사용하면 토큰 단가 차이가 약 3.3배입니다. 한 모델로 전부 처리하는 것보다 역할을 분리하면 출력 토큰 비용을 크게 줄일 수 있습니다.
AGENTS.md와 MCP 서버 최소화
AGENTS.md가 클수록, MCP 서버가 많이 연결될수록 매 요청마다 입력 토큰이 늘어납니다. 프로젝트 내에서 서브 폴더별로 AGENTS.md를 분리하고, 사용하지 않는 MCP 서버는 비활성화하는 것만으로 비용이 실질적으로 줄어듭니다. (출처: developers.openai.com/codex/pricing)
Fast mode는 속도가 필요한 순간에만
Fast mode를 기본으로 켜놓으면 모든 작업에서 크레딧이 2배 소비됩니다. 빠른 응답이 중요한 순간에만 켜고, 백그라운드 자동화나 긴 리팩터링 작업에서는 끄는 것이 핵심입니다. 같은 작업량에 비용 차이가 2배까지 벌어집니다.
경쟁 도구와 비교했을 때 지금 선택 기준
이번 요금 전환과 관련해서 r/codex에서 가장 많이 나온 질문은 “GitHub Copilot이나 다른 도구로 옮겨야 하냐”였습니다. 실제 커뮤니티 비교를 포함해 현재 시점 기준으로 정리해봤습니다.
| 도구 | 과금 구조 | 헤비 유저 월 비용 | 현재 한도 |
|---|---|---|---|
| Codex (Business) | 토큰 기반 | $20 + 추가 크레딧 | 5시간 세션 한도 |
| GitHub Copilot Pro+ | 요청 횟수 기반 | 약 $39 | 1,500 프리미엄 요청/월 |
| Codex (Plus) | 메시지 기반 (아직) | $20 | 5시간 세션 + 주간 한도 |
| Claude Code (Max) | 구독 기반 | $100/$200 | 플랜별 상한 |
커뮤니티에서 공유된 실사용 경험 기준으로 보면, Business 플랜에서 토큰 기반으로 전환된 이후 헤비 유저들이 가장 많이 이동한 대안은 GitHub Copilot Pro+(요청 횟수 기반으로 대형 작업도 1요청으로 처리)였습니다. 단, 이 구조 역시 언제까지 유지될지는 불확실합니다.
솔직히 말하면, 지금 시점에서 “무제한에 가까운 정액제 AI 코딩 도구”는 사실상 없어지고 있습니다. OpenAI가 토큰 기반으로 먼저 움직였고, 나머지 도구들도 같은 방향으로 갈 가능성이 높습니다. 비용을 예측 가능하게 관리하려면 어떤 도구를 쓰든 사용 패턴을 먼저 파악하는 게 더 중요한 시점입니다.
Q&A — 가장 많이 나오는 질문 5가지
마치며
이번 전환의 핵심 구조는 사실 단순합니다. 작업이 작으면 구 요금보다 저렴하고, 작업이 크면 비싸집니다. 출력 토큰 단가가 입력의 8배라는 사실만 기억해도 비용 예측의 절반은 끝납니다.
개인적으로 이 전환에서 가장 주목할 부분은 캐시 입력의 1/10 단가입니다. 같은 프로젝트에서 오래 작업할수록 유리해지는 구조는, 여러 프로젝트를 넘나드는 방식보다 한 리포지토리에 집중하는 개발 패턴에 경제적 인센티브를 주는 셈입니다. 단순한 요금 변경이 아니라 어떻게 작업하느냐에 따라 비용이 달라지는 구조로 바뀐 것입니다.
Plus·Pro 플랜도 수 주 내 토큰 기반으로 전환 예정입니다. 지금 당장은 아니더라도, 사용 패턴을 점검하고 AGENTS.md 크기와 MCP 연결 수를 정리해두는 것이 실질적인 준비입니다.
📎 본 포스팅 참고 자료
- OpenAI Codex Rate Card — help.openai.com/en/articles/20001106-codex-rate-card
- OpenAI Codex Developer Pricing — developers.openai.com/codex/pricing
- ChatGPT Business 릴리스 노트 (2026.04.02) — help.openai.com/ko-kr/articles/11391654
- OpenAI Codex 사용량 기반 요금제 공식 발표 — openai.com/ko-KR/index/codex-flexible-pricing-for-teams
본 포스팅 작성 이후 OpenAI의 서비스 정책·요금·UI·기능이 변경될 수 있습니다. 수치는 OpenAI 공식 문서(2026년 4월 15일 기준)를 근거로 작성했으며, 최신 요금은 반드시 공식 Rate Card에서 직접 확인하시기 바랍니다.

댓글 남기기