OpenAI Codex Windows, 이 작업에서 돈 빠집니다

Published on

in

OpenAI Codex Windows, 이 작업에서 돈 빠집니다

2026.03.19 기준
Codex App v최신 / GPT-5.4 기준

OpenAI Codex Windows,
이 작업에서 돈 빠집니다

2026년 3월 4일, OpenAI가 Codex 앱 Windows 버전을 정식 출시했습니다. “무료로도 쓸 수 있다”는 말이 계속 나오는데, 막상 공식 요금 문서를 열어보면 얘기가 달라집니다. Cloud Task 1건에 34크레딧, Code Review 1건에 34크레딧 — GPT-5.4 기준입니다. 어디서 크레딧이 빠지는지 공식 수치로 짚겠습니다.

50만 명+
Windows 버전 출시 전 대기자
34크레딧
Cloud Task 1건 평균 비용
5배
Cloud vs Local 크레딧 차이

Windows 버전이 나오기까지, 실제 맥락

OpenAI Codex 앱은 2026년 2월 2일에 macOS 버전으로 먼저 출시됐습니다. Windows 개발자들은 한 달 가까이 기다려야 했고, 대기자 명단에 등록한 인원이 50만 명을 넘겼습니다. 그만큼 실수요가 쌓여 있었다는 얘기입니다. (출처: ayoteralab.tistory.com, 2026.03.08)

Codex는 단순한 자동완성 플러그인이 아닙니다. 여러 AI 에이전트를 병렬로 돌릴 수 있는 독립형 코딩 앱입니다. 버그 수정 에이전트를 돌리면서 동시에 테스트 에이전트를 돌리는 게 가능한 구조입니다. macOS 출시 첫 주에 100만 회 이상 다운로드됐고, 현재 주간 활성 사용자는 약 160만 명입니다. (출처: OpenAI 공식 Codex 소개 페이지, 2026.02.02)

GitHub Copilot, Cursor가 이미 자리를 잡고 있는 시장에서 OpenAI가 직접 데스크톱 앱 형태로 개발자 시장을 공략하는 방향은 꽤 직접적입니다. 이 전략이 어디까지 통하는지는 아직 현장에서 검증 중입니다.

▲ 목차로 돌아가기

Windows를 위해 새로 설계한 것들

macOS 버전을 그대로 이식한 게 아닙니다. OpenAI는 Windows 환경을 위해 ‘네이티브 에이전트 샌드박스(Native Agent Sandbox)’를 별도로 설계했습니다. 운영체제 수준의 보안 제어가 들어가고, 파일 시스템 접근 권한(ACL)과 전용 샌드박스 계정이 분리 운용됩니다. AI 에이전트가 시스템 전체에 무분별하게 접근하는 걸 막은 구조입니다. (출처: OpenAI Codex App 공식 발표, 2026.02.02, Windows 업데이트 2026.03.04)

기존에 Windows에서 리눅스 환경 작업을 할 때는 WSL(Windows Subsystem for Linux)이나 가상 머신을 따로 설정해야 했습니다. Codex 앱이 설치되면 PowerShell에서 바로 AI 코딩 작업이 가능해집니다. 설정 부담이 줄어드는 건 실제 도입 장벽을 낮추는 데 중요한 요소입니다.

지원하는 IDE 목록도 넓습니다. Visual Studio, VS Code, Rider, PhpStorm, Sublime Text와 연동되고, 터미널은 PowerShell, Command Prompt, Git Bash, WSL 중 원하는 걸 고를 수 있습니다. 이 샌드박스 코드는 오픈소스(Apache-2.0)로 공개됐습니다.

💡 공식 발표문과 실제 개발자 환경을 같이 놓고 보니, “WSL 없이도 된다”는 표현이 완전히 맞는 말은 아닙니다. Codex 앱의 PowerShell 지원은 확실하지만, 리눅스 전용 툴체인(예: Docker, Make 기반 빌드)을 쓰는 프로젝트는 여전히 WSL이 필요합니다. 공식 문서에서는 이 부분을 명확히 구분하지 않고 있습니다.

▲ 목차로 돌아가기

막상 쓰면 이 단계에서 크레딧이 빠집니다

공식 Codex 요금 페이지(developers.openai.com/codex/pricing, 2026.03 기준)를 직접 확인했습니다. GPT-5.4 기준으로 작업 유형에 따라 크레딧 소모가 확연히 달라집니다.

작업 유형 GPT-5.4 GPT-5.3-Codex GPT-5.1-Codex-mini
Local Task (1건) ~7크레딧 ~5크레딧 ~1크레딧
Cloud Task (1건) ~34크레딧 ~25크레딧 미지원
Code Review (PR 1건) ~34크레딧 ~25크레딧 미지원

Local Task와 Cloud Task의 크레딧 차이는 GPT-5.4 기준으로 약 5배(7 vs 34)입니다. 문제는 어떤 작업이 Cloud Task로 분류되는지 공식 안내가 명확하지 않다는 점입니다. GitHub PR 리뷰(@Codex 태그 방식), Slack 연동 자동화, GitHub Actions 기반 CI 작업은 Cloud Task로 처리됩니다. 그냥 CLI에서 돌리는 로컬 코드 수정은 Local Task입니다. 이 차이를 모르고 쓰면 크레딧이 빠르게 소진됩니다.

💡 Reddit r/codex에서 나온 실사용 데이터 (2026.03.13): “5시간 세션 하나가 주간 제한의 30~31%를 차지한다”는 보고가 있습니다. Plus 플랜 기준 GPT-5.4 Local Task가 5시간에 33~168건이라는 공식 수치(출처: developers.openai.com/codex/pricing, 2026.03)와 맞춰보면, 복잡한 작업 1건이 단순 작업 10건 이상의 크레딧을 소비하는 상황이 실제로 발생한다는 의미입니다.

▲ 목차로 돌아가기

Claude Code와 실제로 다른 점

Codex가 빠르다는 건 맞습니다. GPT-5.3-Codex-Spark는 Cerebras WSE-3 하드웨어에서 1,000토큰/초 이상을 처리합니다. 이건 표준 추론 속도의 약 15배 수준입니다. (출처: morphllm.com/comparisons/codex-vs-claude-code, 2026.02.28)

그런데 여기서 예상을 뒤집는 수치가 있습니다. 벤치마크에서는 Claude Code가 Codex를 앞섭니다. SWE-bench Pro 기준 Claude Opus 4.6이 59.0%, OpenAI Codex가 56.8%입니다. Terminal-Bench 2.0에서는 Codex가 77.3%로 Claude(65.4%)를 역전합니다. 두 도구 모두 잘하는 영역이 다르다는 뜻입니다. (출처: morphllm.com, 2026.02.28 기준)

비교 항목 OpenAI Codex Claude Code
SWE-bench Pro 56.8% 59.0% ✓
Terminal-Bench 2.0 77.3% ✓ 65.4%
토큰 사용량 (동일 작업) 1x (기준) 3.2~4.2x 더 소비
처리 속도 1,000+ 토큰/초 ~200 토큰/초
컨텍스트 윈도우 200K~400K 토큰 1M 토큰 (베타)
$20/월 한도 세션 더 많은 세션 더 빨리 소진

VS Code 별점에서도 차이가 납니다. Claude Code가 5.2M 설치에 4.0/5, Codex가 4.9M 설치에 3.4/5입니다. (출처: morphllm.com, 2026.02.28) 더 많이 팔렸는데 만족도가 낮은 건 주목할 만한 지점입니다. 속도가 전부가 아니라는 현장 피드백으로 읽을 수 있습니다.

▲ 목차로 돌아가기

Plus 요금제로 하루 얼마나 쓸 수 있나요?

공식 한도를 직접 계산해봤습니다. ChatGPT Plus($20/월, 한화 약 2만 9천 원) 기준 GPT-5.4 Local Task는 5시간에 33~168건입니다. 범위가 넓은 이유는 작업 복잡도에 따라 실제 소모가 달라지기 때문입니다. (출처: developers.openai.com/codex/pricing, 2026.03.19 기준)

📊 Plus 플랜 실용 계산

• 단순 로컬 작업 위주: 5시간에 최대 168건 → 하루 활용 충분
• 복잡한 작업 혼합: 5시간에 최저 33건 → 오전 작업만으로 한도 도달 가능
• Cloud Task(34크레딧) 3건 연달아 실행 = Local Task(7크레딧) 약 14건 소모와 동일
• GPT-5.4-mini로 전환 시 한도 약 2.5~3.3배 연장 (공식 안내)

한도 초과 후에는 크레딧을 추가 구매해서 이어쓸 수 있습니다. 또는 API 키를 직접 연결해 로컬 작업을 이어가는 방법도 있습니다. 단, API 키 방식은 Cloud Task 기능(GitHub PR 자동 리뷰, Slack 연동 등)을 사용할 수 없습니다. (출처: developers.openai.com/codex/pricing)

Pro 플랜($200/월)으로 올라가면 GPT-5.4 Local Task 기준 5시간에 223~1,120건, 우선 처리, GPT-5.3-Codex-Spark(리서치 프리뷰) 접근이 추가됩니다. 일상 코딩 작업으로 Codex를 주력으로 쓰고 싶다면 Plus보다 Pro가 현실적인 선택입니다.

▲ 목차로 돌아가기

이 조건이면 Codex가 유리합니다

지금까지 나온 데이터와 실사용 후기를 교차 분석하면, Codex가 Claude Code보다 유리한 조건이 꽤 구체적으로 그려집니다. 단순히 “빠르니까 좋다”는 얘기가 아닙니다.

💡 Codex의 클라우드 샌드박스 구조를 보면, 각 작업이 독립된 컨테이너에서 실행됩니다. 이게 의미하는 건 여러 작업을 병렬로 돌릴 때 앞 작업의 컨텍스트가 뒷 작업을 오염시키지 않는다는 겁니다. 반면 Claude Code의 Agent Teams는 서로 공유 파일에 접근할 수 있어서 협력 가능하지만, 그만큼 토큰을 더 씁니다. 어떤 구조가 유리한지는 작업의 독립성 여부에 달려 있습니다.

Codex가 더 유리한 상황은 다음 경우입니다. 스펙을 상세히 작성해두고 결과만 받고 싶을 때, 특히 서로 독립적인 여러 작업을 동시에 돌릴 때는 클라우드 샌드박스 방식이 효율적입니다. 반대로 의존성이 복잡하게 얽힌 대형 코드베이스 리팩토링, 여러 에이전트가 서로 결과를 참조해야 하는 작업에서는 Claude Code의 Agent Teams가 강점을 보입니다. (출처: morphllm.com/comparisons, 2026.02.28)

Harvey 모바일 리드의 실제 사례가 공식 페이지에 올라와 있습니다. “Codex가 초기 반복 작업 시간을 30~50% 단축했고, 엔지니어들이 시스템 설계 같은 핵심 결정에 집중할 수 있게 됐다”는 내용입니다. (출처: openai.com/ko-KR/codex/) 이 사례가 의미하는 건, Codex가 반복적이고 명확한 범위의 작업에서 효율을 내고 있다는 것입니다.

두 도구를 병행하는 방식도 실사용자들 사이에서 퍼지고 있습니다. 빠른 초안 작성은 Codex로, 코드 리뷰와 복잡한 리팩토링은 Claude Code로 나눠 쓰는 흐름입니다. 어느 하나가 완전히 앞서는 구도는 아직 아닌 것 같습니다.

▲ 목차로 돌아가기

자주 묻는 질문

Q. OpenAI Codex Windows 버전은 무료로 쓸 수 있나요?

한시적으로 ChatGPT Free·Go 플랜에서도 Codex 사용이 가능합니다. 단, 포함된 사용량이 소진되면 크레딧을 구매해야 합니다. Plus 이상에서는 기본 제공 한도가 2배로 늘어납니다. 이 ‘한시적’ 정책이 언제까지인지 공식 종료 일정은 공개되지 않았으므로 확인 필요합니다. (출처: developers.openai.com/codex/pricing)

Q. WSL 없이 Windows에서 Codex를 쓸 수 있나요?

PowerShell, Command Prompt, Git Bash 환경에서는 WSL 없이 사용 가능합니다. 단, Linux 전용 툴체인(Docker 기반 빌드, Makefile 등)이 필요한 프로젝트는 WSL이 여전히 필요합니다. “WSL 불필요”라는 표현은 일반적인 Windows 개발 환경을 전제한 것입니다.

Q. Cloud Task와 Local Task의 차이가 뭔가요?

Local Task는 개발자 로컬 환경(PC)에서 실행되는 코딩 작업입니다. Cloud Task는 GitHub PR 자동 리뷰(@Codex 태그), Slack 연동, GitHub Actions CI 등 클라우드 인프라를 통해 실행되는 작업입니다. GPT-5.4 기준 크레딧 소모 차이는 약 5배(7 vs 34크레딧)입니다. (출처: help.openai.com/ko-kr/articles/20001106-codex-rate-card)

Q. Codex가 Claude Code보다 성능이 좋은가요?

벤치마크마다 결과가 다릅니다. Terminal-Bench 2.0에서는 Codex 77.3%로 Claude 65.4%를 앞서고, SWE-bench Pro에서는 Claude 59.0%가 Codex 56.8%를 앞섭니다. 처리 속도는 Codex가 압도적(1,000+ 토큰/초 vs ~200토큰/초)이지만, 동일 작업 토큰 소모량은 Claude가 3.2~4.2배 더 씁니다. 어느 쪽이 “좋다”는 단순 결론은 나오지 않습니다. (출처: morphllm.com, 2026.02.28)

Q. 한도 초과 후 어떻게 되나요?

Plus·Pro 플랜에서는 추가 크레딧을 구매해 이어 쓸 수 있습니다. GPT-5.4-mini 모델로 전환하면 한도를 2.5~3.3배 더 늘릴 수도 있습니다. API 키를 직접 연결해 로컬 작업을 이어가는 방법도 있지만, 이 경우 Cloud Task 기능(GitHub 리뷰, Slack 연동)은 사용할 수 없습니다. (출처: developers.openai.com/codex/pricing)

▲ 목차로 돌아가기

마치며 — 총평

OpenAI Codex Windows 버전은 맥 사용자 전용이던 도구가 실제 국내 개발자 대다수의 환경으로 들어온 사건입니다. 네이티브 샌드박스 설계, 주요 IDE 연동, PowerShell 지원은 분명 실질적인 개선입니다.

그런데 “무료로도 써볼 수 있다”는 말에서 멈추면 놓치는 게 있습니다. Cloud Task 1건이 Local Task의 5배 크레딧을 먹고, 한 세션이 Plus 주간 한도의 30%를 소진한다는 수치는 공식 문서에 있지만 눈에 잘 안 띄는 곳에 있습니다. 이걸 모르고 쓰면 예상보다 빨리 벽에 부딪힙니다.

성능 면에서는 “Codex가 Claude Code보다 낫다”거나 그 반대라는 결론도 아직 이릅니다. 속도 면에서 Codex가 앞서고, 정밀도와 컨텍스트 관리 면에서 Claude Code가 앞서는 국면이 공존하고 있습니다. VS Code 별점 격차(4.0 vs 3.4)는 실사용 경험이 아직 기대에 다 못 미치고 있다는 신호로 읽힙니다.

개인적으로는, 지금 Codex를 주력으로 쓰려면 Plus보다는 Pro가 현실적이고, 작업 유형을 로컬 중심으로 세팅하는 편이 크레딧 효율에 유리합니다. GitHub 리뷰 자동화를 많이 돌린다면 Cloud Task 비용이 빠르게 누적된다는 점을 먼저 체크해야 합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI Codex App 공식 소개 (2026.02.02, Windows 업데이트 2026.03.04)
  2. Codex 공식 요금 페이지 — developers.openai.com
  3. Codex Rate Card (Credit 비용표) — OpenAI Help Center (2026.03.06)
  4. Codex vs Claude Code 벤치마크 비교 — morphllm.com (2026.02.28)

※ 본 포스팅은 2026년 3월 19일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 요금제·크레딧 정책은 OpenAI 공식 사이트에서 최신 정보를 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기