Research Preview
IT/AI
Codex Security, Plus 구독자는 쓸 수 없습니다
2026년 3월 6일, OpenAI가 Codex Security를 공개했습니다. “AI가 내 코드의 취약점을 자동으로 찾아 수정까지 해준다”는 문구에 많은 개발자가 귀를 기울였는데, 정작 쓸 수 있는 사람이 생각보다 훨씬 적습니다. 무료 한 달 제공이라고 하지만 ChatGPT Plus 구독자는 접근 자체가 안 됩니다. 30일간 120만 건 커밋을 스캔해 Critical 취약점 792개를 찾아낸 숫자도 인상적이지만, 그 숫자에 가려진 부분이 있습니다.
Codex Security는 무엇인가 — Aardvark의 변신
Codex Security는 OpenAI가 2025년 10월 비공개 베타로 테스트하던 Aardvark를 공개 연구 프리뷰로 전환하면서 붙인 이름입니다. (출처: OpenAI 공식 블로그, 2026.03.06) 단순히 이름만 바뀐 게 아니라, 접근 대상을 확장하고 스캔 규모도 대폭 늘렸습니다.
작동 방식은 기존 정적 분석 도구와 다릅니다. 코드 패턴을 검색하는 대신 레포지토리 전체의 구조를 읽고 위협 모델(Threat Model)을 먼저 만듭니다. 시스템이 어떤 역할을 하고, 어디가 신뢰 경계인지 파악한 뒤, 실제로 공격 가능한 경로를 추론합니다.
취약점 후보를 찾으면 샌드박스 환경에서 재현 시도를 합니다. 재현이 안 되면 보고하지 않습니다. 인간 보안 연구원이 취약점을 검증하는 흐름과 동일하게 설계됐고, OpenAI는 이 구조 덕분에 오탐이 줄었다고 주장합니다.
Plus 사용자가 접근 안 되는 이유
OpenAI 공식 발표에는 “무료로 한 달간 사용 가능”이라는 문구가 있습니다. 그런데 공식 문서를 직접 확인하면 접근 가능 플랜이 따로 명시돼 있습니다. (출처: OpenAI 공식 블로그, 2026.03.06)
💡 공식 문서에 나온 접근 가능 플랜
| 플랜 | Codex Security 접근 | 월 비용 |
|---|---|---|
| Free / Go | ❌ 불가 | – |
| Plus | ❌ 불가 | 약 $20/월 |
| Pro | ✅ 가능 | 약 $200/월 |
| Enterprise | ✅ 가능 | 별도 협의 |
| Business / Edu | ✅ 가능 | 별도 협의 |
출처: OpenAI 공식 블로그 (2026.03.06) / Codex Security 공식 문서
월 $20를 내는 ChatGPT Plus 사용자에게는 접근권이 없습니다. 개인 개발자 입장에서 현실적인 진입점은 Pro($200/월)인데, 그 차이가 10배입니다. OpenAI는 오픈소스 메인테이너에게는 무료 접근을 별도로 제공하고 있고 (출처: OpenAI 공식 블로그, 2026.03.06), 신청 양식은 openai.com/form/codex-for-oss에 있습니다.
오픈소스 기여자라면 별도 신청 경로가 있다는 점은 많은 글에서 빠진 부분입니다. 상업 프로젝트를 개인 Pro로 쓰는 건 가능하지만, 팀 단위라면 Enterprise 계약이 사실상 전제됩니다.
792개 Critical 수치, 맥락을 같이 봐야 합니다
“30일간 120만 건 커밋 스캔, Critical 792개 발견.” 이 숫자는 인상적입니다. 그런데 OpenAI가 함께 공개한 수치가 하나 더 있습니다. Critical 발견은 전체 스캔 커밋의 0.1% 미만에서 나왔습니다. (출처: OpenAI 공식 블로그, 2026.03.06)
이 수치를 반대로 읽으면, 나머지 99.9%의 커밋에서는 Critical을 찾지 못했다는 뜻입니다. 광범위한 스캔 대비 발견율은 낮습니다. 이게 좋은 신호일 수도 있고(오탐 억제), 탐지 범위의 한계일 수도 있습니다. OpenAI가 공식 답변을 내놓지 않은 부분입니다.
💡 공식 발표 수치와 실제 스캔 흐름을 같이 보면 이런 비율이 나옵니다
스캔 커밋: 1,200,000건
Critical 발견 커밋: 약 1,200건 이하 (0.1% 미만)
High 발견: 10,561건
출처: OpenAI 공식 블로그, 2026.03.06
같은 레포지토리를 반복 스캔했을 때 시간이 지날수록 정밀도는 올라가고 오탐은 낮아지는 추세도 공개됐습니다. 즉, 첫 스캔보다 두 번째, 세 번째 스캔이 더 정확해지는 학습 구조입니다. 한 번 쓰고 끝내는 도구가 아니라, 반복 사용을 전제로 설계됐다는 뜻입니다.
오탐률 50% 감소의 실제 의미
OpenAI는 “false positive rate이 50% 이상 감소했다”고 밝혔습니다. (출처: OpenAI 공식 블로그, 2026.03.06) 이 문장을 처음 보면 오탐이 절반으로 줄었다고 읽힙니다. 그런데 기준점이 어디냐에 따라 의미가 완전히 달라집니다.
기준 오탐률이 80%였다면 50% 감소는 40%입니다. 기준이 20%였다면 50% 감소는 10%입니다. OpenAI는 초기 베타 대비 감소율을 말하는 것이지, 절대 오탐률을 공개하지 않았습니다.
독립 연구기관인 Semgrep이 Claude Code(Sonnet 4 기반)와 Codex를 대상으로 Python 웹 애플리케이션 11개를 테스트한 결과, Claude Code는 취약점 46개를 찾았는데 실제 true positive는 14%(=6~7개), Codex는 21개를 찾아 18%가 실제였습니다. (출처: Semgrep 연구 보고서, Orbilontech 2026.02.21 인용) 둘 다 오탐률이 80% 이상이었습니다.
💡 Semgrep 테스트 결과를 Codex Security 발표 수치와 같이 놓고 보면
기존 Codex(API 기반) 오탐률 약 82% → Codex Security는 이보다 50% 감소를 주장 → 즉 Codex Security의 추정 오탐률은 약 40~45% 수준으로 예상됩니다.
※ OpenAI가 절대 수치를 공개하지 않아, 위는 Semgrep 기준치 역산 추정입니다.
추정 오탐률 40~45%는 기존 도구보다 나아진 수치입니다. 그런데 보안팀 입장에서는 여전히 절반에 가까운 알림을 인간이 재검토해야 한다는 뜻이기도 합니다. AI가 경보를 줄이는 게 아니라 경보 유형을 바꾸는 수준일 수 있습니다.
AI가 만든 코드를 AI가 검사하는 구조
2026년 현재, Codex CLI(코딩 에이전트)가 작성한 코드는 GitHub 전체 공개 커밋의 약 4%를 차지합니다. (출처: Orbilontech 2026.02.21) 이 비율은 계속 올라가고 있습니다. Claude Code, Cursor, Copilot을 합하면 AI 생성 코드의 비중은 훨씬 큽니다.
AI가 코드를 빠르게 생성할수록, 그 코드의 보안 검토를 인간이 따라가기 어렵습니다. Codex Security는 이 문제를 AI로 다시 해결하는 구조입니다. 생성도 AI, 검증도 AI인 흐름입니다. Anthropic의 보안팀이 언론에 밝힌 것처럼, “AI 코딩 도구로 코드 생성 속도가 빨라질수록 그 코드의 보안 검토 수요도 동시에 폭발한다.” (출처: Orbilontech, Fortune 인용, 2026.02.21)
💡 오픈소스 발표 자료와 실제 사용 흐름을 같이 보면 이런 구조가 보입니다
Codex CLI(생성) → 코드베이스 증가 → Codex Security(검증) 수요 증가 → Pro 구독 필요 → OpenAI 수익 확대. 이 구조는 AI 코딩 도구를 많이 쓸수록 보안 도구 구독 필요성도 함께 높아지는 피드백 루프입니다.
이 구조에서 가장 주의할 점은 AI가 생성한 코드가 기존 인간 코드와 다른 취약점 패턴을 가질 수 있다는 것입니다. AI는 동일한 패턴을 반복하는 경향이 있어, 취약점도 반복될 가능성이 있습니다. Codex Security가 이런 AI 특유의 패턴에 최적화됐는지는 아직 공개된 데이터가 없습니다.
Claude Code Security와 뭐가 다른가
2026년 2월 20일, Anthropic이 먼저 Claude Code Security를 출시했습니다. (출처: Orbilontech, 2026.02.21) Codex Security는 약 2주 뒤에 나왔습니다. 두 도구를 직접 비교하면 차이가 명확합니다.
| 항목 | Codex Security | Claude Code Security |
|---|---|---|
| 기반 모델 | GPT-5.3-Codex | Claude Opus 4.6 |
| 인터페이스 | ChatGPT Codex 웹 | Claude Code CLI + 웹 |
| 접근 가능 플랜 | Pro·Enterprise·Business·Edu | Enterprise·Team |
| 검증된 CVE 수 | 14개 | 500개 이상(내부 발표) |
| 컨텍스트 창 | 레포지토리 단위 | 1M 토큰(코드베이스 전체) |
주목할 차이는 접근 가능 플랜입니다. Claude Code Security는 Enterprise·Team 전용이라 개인 Pro 사용자도 못 씁니다. Codex Security는 개인 Pro($200/월)가 가능하다는 점에서 진입 문턱이 조금 낮습니다. “낮다”고 해도 Plus 대비 10배 비용이지만요.
Checkmarx의 분석에 따르면, 두 도구 모두 레포지토리 수준 분석에 특화돼 있고 컨테이너, IaC, SCA(소프트웨어 구성 분석) 같은 공급망 전체 보안은 커버하지 않습니다. (출처: Checkmarx LinkedIn, 2026.03.18) 기존 AppSec 플랫폼을 대체하기보다 하나의 레이어로 추가되는 형태입니다.
14개 CVE, 어디서 나왔나
Codex Security가 발견해 실제로 CVE가 발급된 취약점은 현재까지 14개입니다. (출처: The Hacker News, 2026.03.07 / OpenAI 공식 블로그, 2026.03.06) 어떤 프로젝트에서 나왔는지를 보면 이게 왜 의미 있는지 더 잘 보입니다.
📋 CVE 발급된 주요 프로젝트와 취약점 유형
- GnuPG — CVE-2026-24881, CVE-2026-24882 (스택 버퍼 오버플로우)
- GnuTLS — CVE-2025-32988, CVE-2025-32989 (Heap Buffer 오버리드, Double-Free)
- GOGS — CVE-2025-64175, CVE-2026-25242 (2FA 우회, 미인증 접근)
- Thorium(CISA 등록 라이브러리) — CVE-2025-35430~35436 (경로 순회, DoS, 세션 미갱신 등)
출처: OpenAI 공식 블로그 2026.03.06 / The Hacker News 2026.03.07
GnuPG와 GnuTLS는 리눅스 환경에서 암호화의 기반이 되는 라이브러리입니다. 수십 년간 전 세계 보안 전문가들이 검토해 온 코드베이스에서 스택 오버플로우가 나왔다는 건, “잘 쓰던 코드니까 안전하다”는 전제가 더 이상 통하지 않는다는 뜻입니다.
다만 이 14개는 공개 오픈소스 레포지토리 기준입니다. 기업 내부 코드베이스에서는 훨씬 많거나 적을 수 있습니다. 오픈소스 레포지토리가 오랜 코드 히스토리를 갖고 있어 취약점이 숨어 있을 가능성이 높은 환경이었습니다. 사내 신규 프로젝트와는 조건이 다릅니다.
Q&A
Q1. ChatGPT Plus 사용자는 정말 Codex Security를 전혀 못 쓰나요?
현재(2026.03.22 기준)는 Plus로 접근이 되지 않습니다. OpenAI 공식 문서에 접근 가능 플랜을 Pro·Enterprise·Business·Edu로 명시하고 있습니다. 다만 리서치 프리뷰 단계라 향후 플랜 확대 가능성은 열려 있습니다.
Q2. 오픈소스 프로젝트 메인테이너가 아닌 일반 개인 개발자가 무료로 쓸 방법은 없나요?
현재는 없습니다. 오픈소스 메인테이너 무료 신청 경로(openai.com/form/codex-for-oss)와 Pro 플랜($200/월) 두 가지만 개인이 접근할 수 있는 방법입니다. 상업 목적이 없는 개인 프로젝트라도 오픈소스로 공개된 경우 메인테이너 신청이 가능한지는 OpenAI가 공식 답변을 내놓지 않은 부분입니다.
Q3. Codex Security가 찾은 취약점은 수동 검토 없이 자동 패치해도 되나요?
자동 패치는 권장하지 않습니다. OpenAI 자체 설계도 인간이 검토 후 승인하는 방식입니다. 독립 연구(Semgrep)에서 기존 AI 스캐너의 오탐률이 80%를 넘었고, Codex Security도 절대 오탐률을 공개하지 않고 있습니다. 패치 전 반드시 수동 검증이 필요합니다.
Q4. 기존 GitHub Advanced Security, Snyk 같은 도구와 같이 써야 하나요?
Checkmarx의 분석에 따르면, Codex Security는 레포지토리 코드 분석에 특화돼 있고 컨테이너, IaC, SCA(의존성 분석), CI/CD 파이프라인 보안은 커버하지 않습니다. 기존 도구와 대체 관계가 아니라 레이어 추가입니다. 현재로선 병행 사용이 현실적입니다.
Q5. “리서치 프리뷰”는 언제 정식 출시가 되나요?
OpenAI가 구체적인 GA(General Availability) 일정을 발표하지 않았습니다. 무료 사용 기간은 출시일 기준 30일(약 2026년 4월 초)까지입니다. 이후 가격 정책이 어떻게 바뀔지는 아직 이유와 시기 모두 공개되지 않았습니다.
마치며
Codex Security는 분명 기존 보안 스캐너와 다른 접근입니다. 패턴 매칭이 아닌 컨텍스트 기반 추론, 샌드박스 재현 검증, 피드백 학습을 결합한 구조는 방향 자체가 맞습니다. 수십 년 된 오픈소스 코드에서 CVE를 14개 새로 찾아낸 결과도 실질적입니다.
그런데 지금 쓸 수 있는 사람이 누구냐를 보면 그 범위가 좁습니다. Plus 사용자에게는 문이 닫혀 있고, Pro부터는 월 $200입니다. 오탐률 절대 수치는 공개하지 않았고, 스캔 범위는 레포지토리 코드에 한정됩니다.
솔직히 말하면, 지금 당장 “써봐야겠다”는 생각이 드는 사람은 기업 보안팀이나 오픈소스 메인테이너입니다. 개인 개발자라면 오픈소스 무료 신청 경로를 확인하거나, 리서치 프리뷰가 끝난 이후의 가격 정책을 지켜보는 게 현실적입니다. AI 보안 도구 경쟁은 2026년 안에 더 빠르게 움직일 것이고, 접근 문턱도 달라질 가능성이 높습니다.
📚 본 포스팅 참고 자료
- OpenAI 공식 블로그 — Codex Security 리서치 프리뷰 공개 (2026.03.06)
- The Hacker News — OpenAI Codex Security Scanned 1.2 Million Commits (2026.03.07)
- SecurityWeek — OpenAI Rolls Out Codex Security Vulnerability Scanner (2026.03.10)
- CSO Online — OpenAI says Codex Security found 11,000 high-impact bugs (2026.03.09)
- Checkmarx (LinkedIn Pulse) — Claude Code Security vs. Codex Security 비교 분석 (2026.03.18)
- Orbilontech — Claude Code Security AI Vulnerability Scanner Guide (2026.02.21)
- Semgrep 연구팀 — AI 에이전트 보안 스캐너 오탐률 연구 (2026년 초)
⚠️ 본 포스팅은 2026년 3월 22일 기준으로 작성됐습니다. Codex Security는 현재 리서치 프리뷰 단계로, 본 포스팅 작성 이후 서비스 정책·접근 가능 플랜·UI·기능이 변경될 수 있습니다. 보안 도구 도입 전 공식 문서를 직접 확인하시길 권장합니다.











댓글 남기기