Codex Security, 버그를 많이 찾는 게 목표가 아닙니다

Published on

in

Codex Security, 버그를 많이 찾는 게 목표가 아닙니다

IT/AI
2026.03.06 기준 / Research Preview
ChatGPT Pro·Enterprise·Business·Edu

Codex Security, 버그를 많이 찾는 게 목표가 아닙니다

2026년 3월 6일, OpenAI가 Codex Security를 리서치 프리뷰로 공개했습니다. 30일 안에 120만 건 커밋을 스캔해 취약점 1만 1,353건을 발견했다는 수치가 먼저 퍼졌는데, 막상 공식 문서를 읽어보면 OpenAI가 정말 강조하는 건 따로 있습니다.

792건
Critical 취약점
84%
노이즈 감소(베타)
50%↓
오탐률 감소
30일 무료
리서치 프리뷰 기간

Codex Security가 뭔지, 30초 요약

Codex Security는 OpenAI가 2026년 3월 6일 공개한 애플리케이션 보안 에이전트입니다. 이전에는 Aardvark라는 내부 코드명으로 2025년 10월부터 소수의 기업 고객을 대상으로 비공개 베타를 운영하다가, 이번에 리서치 프리뷰로 전환하면서 ChatGPT Pro·Enterprise·Business·Edu 사용자에게 30일간 무료로 제공됩니다. (출처: OpenAI 공식 블로그, 2026.03.06)

작동 흐름은 세 단계입니다. 저장소를 분석해 프로젝트 전용 위협 모델을 생성하고 → 그 위협 모델을 기준으로 취약점을 탐색해 실제 영향도 기반으로 분류한 뒤 → 샌드박스 환경에서 검증을 마친 이슈에 대해 수정 패치까지 제안합니다. 분석만 하고 끝나는 스캐너가 아니라, 검증 증거와 패치를 함께 내놓는 구조입니다.

현재는 Codex 웹(codex.com)을 통해 접근하며, API 형태의 독립 배포는 지원하지 않습니다. 이 부분은 아래에서 더 자세히 다룹니다.

▲ 목차로 돌아가기

120만 커밋 스캔, 수치가 보여주는 진짜 의미

공식 블로그에 공개된 수치를 그대로 옮기면, 30일 동안 120만 건 이상의 커밋을 스캔해 Critical 취약점 792건, High-severity 취약점 10,561건을 발견했습니다. 합산하면 11,353건입니다. (출처: OpenAI 공식 블로그, 2026.03.06)

💡 공식 발표 수치와 실제 운영 흐름을 같이 놓고 보니 이런 차이가 보였습니다

Critical 취약점 792건은 전체 120만 커밋의 0.1% 미만에서만 발견됐습니다. 숫자가 크게 들리지만 실제로는 극히 드문 케이스만 걸러낸 겁니다. 다른 AI 보안 도구들이 과도하게 많은 경고를 내뱉어 팀이 트리아지(triage)에 녹아내리는 문제를 겪는 것과 비교하면, 낮은 비율 자체가 이 도구의 핵심 가치입니다.

더 주목할 수치는 베타 기간 동안의 개선 폭입니다. 같은 저장소를 반복 스캔한 결과, 초기 배포 대비 노이즈가 84% 감소했고, 심각도가 과도하게 높게 표시되는 비율은 90% 이상 줄었으며, 오탐률(false positive)은 전 저장소 평균 50% 이상 감소했습니다. (출처: OpenAI 공식 블로그, 2026.03.06) 처음부터 완벽한 게 아니라, 피드백을 받을수록 정밀도가 올라가는 구조입니다.

지표 수치 의미
30일 스캔 커밋 수 120만 건 이상 베타 코호트 외부 저장소 기준
Critical 발견 건수 792건 전체 커밋의 0.1% 미만
High-severity 발견 건수 10,561건 CVE 14건 포함(오픈소스 프로젝트)
노이즈 감소율 (베타 기간) 84% 동일 저장소 반복 스캔 비교
오탐률 감소율 50% 이상 전 저장소 평균 기준

※ 표 내 수치 출처: OpenAI 공식 블로그 (2026.03.06), openai.com/index/codex-security-now-in-research-preview

▲ 목차로 돌아가기

SAST 리포트를 안 쓰는 이유가 약점처럼 들립니다

보안 도구를 써본 분들이 바로 드는 의문이 있습니다. “그럼 기존 SAST(정적 분석) 결과는 왜 안 가져다 씁니까?” OpenAI가 3월 16일 별도 공식 포스팅으로 이 질문에 직접 답했습니다.

💡 “도구가 없어서”가 아니라 “앞에 깔아두면 오히려 방해가 돼서”입니다

SAST 리포트를 시작점으로 쓰면 에이전트가 “그 도구가 이미 본 곳”에 과도하게 집중하게 됩니다. 즉, 기존 도구의 시각 안에서만 맴돌다가 그 도구가 놓친 취약점 유형을 처음부터 놓쳐버립니다. OpenAI는 이를 “premature narrowing(조기 협소화)”이라고 표현했습니다. (출처: OpenAI 공식 블로그, “Why Codex Security Doesn’t Include a SAST Report”, 2026.03.16)

공식 문서가 드는 예시가 명확합니다. sanitize_html()을 호출한 코드에서 SAST는 “sanitizer가 실행됐음”만 확인합니다. 하지만 실제 위협은 그 다음 단계, 즉 URL 디코딩 → 리다이렉트 핸들러로 넘어가는 변환 체인에서 sanitizer가 의도대로 값을 제한하는지 여부에 있습니다. OpenSSL에 영향을 준 CVE-2024-29041(Express 오픈 리다이렉트)이 실제 이 패턴으로 발생한 취약점입니다. 데이터 흐름은 눈에 보였는데, 변환 체인에서 검사가 무력화됐습니다.

Codex Security는 저장소를 처음부터 읽고, 취약점 후보를 찾으면 z3-solver가 포함된 Python 환경에서 제약 조건을 수학적으로 검증하거나 샌드박스에서 직접 PoC(개념 증명)를 실행합니다. “이게 문제일 수도 있다”와 “이게 실제로 터진다, 증거가 여기 있다”를 구분하는 게 핵심입니다. 실제로 동작하는 PoC까지 생성해서 보안팀에 전달합니다. (출처: OpenAI 공식 블로그, “Why Codex Security Doesn’t Include a SAST Report”, 2026.03.16)

▲ 목차로 돌아가기

지금 쓸 수 있는 사람과 못 쓰는 사람

현재(2026.03.22 기준) Codex Security는 ChatGPT Pro, Enterprise, Business, Edu 구독자가 Codex 웹(codex.com)에서 접근할 수 있습니다. ChatGPT Free·Plus 구독자는 해당되지 않습니다. 무료 사용 기간은 리서치 프리뷰 전환 시점(2026.03.06)으로부터 30일입니다. 이후 요금 정책은 OpenAI가 공식 답변을 내놓지 않은 상태입니다.

오픈소스 프로젝트 관리자라면 별도 경로가 있습니다. Codex for OSS 프로그램을 통해 무료 ChatGPT Pro 계정과 Codex Security 접근권을 신청할 수 있습니다. vLLM 프로젝트가 이미 이 프로그램으로 실제 취약점을 발견하고 패치했습니다. 신청 링크는 공식 사이트 openai.com/form/codex-for-oss에서 확인할 수 있습니다.

솔직히 말하면, 지금 단계에서 개인 개발자가 직접 쓰기에는 진입 문턱이 꽤 있습니다. 프로 구독료(월 $200, 한화 약 29만 원)가 전제가 되고, 실제 효과를 내려면 환경에 맞게 스캔 설정을 잡아야 합니다. 팀 단위 엔터프라이즈 워크플로에 맞게 설계된 도구라는 느낌이 더 강합니다.

▲ 목차로 돌아가기

오픈소스 생태계에 미치는 영향

OpenAI는 오픈소스 관리자들과 대화를 나누면서 공통된 이야기를 들었다고 밝혔습니다. “보고서가 부족한 게 아니라, 품질 낮은 보고서가 너무 많다”는 겁니다. 실제로 Codex Security를 오픈소스 저장소에 적용한 결과, OpenSSH·GnuTLS·GOGS·Thorium·libssh·PHP·Chromium 등에서 총 14건의 CVE가 발행됐습니다. (출처: OpenAI 공식 블로그, 2026.03.06; The Hacker News, 2026.03.07)

💡 도구가 바뀐 게 아니라, 관리자가 받는 리포트의 질이 바뀝니다

기존에는 보안 리포트 하나가 들어와도 재현이 안 되거나, 맥락이 없어서 무시해야 할 경우가 많았습니다. Codex Security는 샌드박스에서 검증된 PoC와 패치를 함께 제출하기 때문에, 관리자 입장에서는 “이게 진짜 터지는지 확인하는 시간”이 사라집니다. 14건의 CVE 모두 관리자가 빠르게 패치를 적용할 수 있도록 수정 코드까지 함께 제출됐습니다.

발견된 취약점 중 눈에 띄는 케이스는 GnuTLS의 힙 버퍼 오버플로우(CVE-2025-32990)GOGS의 2FA 인증 우회(CVE-2025-64175)입니다. GnuTLS는 수많은 시스템의 TLS 구현에 쓰이는 기반 라이브러리이고, GOGS는 경량 Git 서비스로 소규모 팀에서 자주 씁니다. 기반 라이브러리의 힙 오버플로우는 원격 코드 실행으로 이어질 수 있는 유형이라 발견 자체의 의미가 큽니다.

▲ 목차로 돌아가기

Claude Code Security와 뭐가 다릅니까

SecurityWeek 기사(2026.03.10)에 따르면, Anthropic이 Codex Security 발표 직전에 Claude Code Security를 공개했고, 두 발표가 연달아 나오면서 주요 사이버보안 기업 주가가 하락하기도 했습니다. 두 도구 모두 AI 기반 취약점 탐색을 지향하지만 접근 방식에 차이가 있습니다.

항목 Codex Security Claude Code Security
출시 시점 2026.03.06 (리서치 프리뷰) 2026년 2월 (정확한 날짜 미공개)
접근 방식 위협 모델 생성 후 샌드박스 검증, PoC 생성 코드베이스 스캔 후 취약점 제안 및 패치
SAST 의존 여부 의도적으로 미사용 공식 문서에서 별도 이유를 밝히지 않았습니다
사용 요건 ChatGPT Pro·Enterprise·Business·Edu Claude Code 구독 (Claude Pro 이상)
오픈소스 지원 Codex for OSS 프로그램 별도 운영 이유는 아직 공개되지 않았습니다

비교해서 쓸 수 있는 직접적인 벤치마크 자료는 아직 없습니다. 두 도구가 경쟁 구도에 있다는 사실 자체가 기업 보안 팀 입장에선 좋은 신호이긴 합니다. 당분간은 어떤 구독을 이미 갖고 있느냐가 선택의 가장 큰 기준이 될 것 같습니다.

▲ 목차로 돌아가기

자주 묻는 질문 5가지

Q1. ChatGPT Plus 구독자도 쓸 수 있나요?
현재(2026.03.22 기준)는 쓸 수 없습니다. Pro·Enterprise·Business·Edu만 해당됩니다. OpenAI가 Plus로 확대할 계획을 공식적으로 밝히지 않았습니다.
Q2. 30일 무료 이후 요금은 어떻게 되나요?
OpenAI가 공식 요금 정책을 발표하지 않은 상태입니다. TechRadar 기사(2026.03.09)는 “향후 추가 요금이 붙을 것으로 보인다”고 보도했지만 공식 확인은 되지 않았습니다.
Q3. Codex CLI와 Codex Security는 같은 건가요?
다릅니다. Codex CLI는 터미널에서 코딩 작업을 지시하는 개발 도구이고, Codex Security는 저장소의 보안 취약점을 탐색·검증·패치하는 보안 에이전트입니다. 인터페이스도 다르고, Codex Security는 Codex 웹에서만 동작합니다.
Q4. 오픈소스 프로젝트 관리자는 어떻게 신청하나요?
openai.com/form/codex-for-oss에서 신청할 수 있습니다. 승인 시 무료 ChatGPT Pro 계정과 Codex Security 접근권을 제공합니다. 현재 초기 코호트 온보딩 중이며, OpenAI는 향후 몇 주 안에 더 많은 관리자를 받겠다고 밝혔습니다.
Q5. 기존 SAST 도구(Snyk, SonarQube 등)를 대체하나요?
OpenAI 공식 입장은 “대체”가 아닌 “보완”입니다. 공식 문서에서 “SAST는 표준화된 패턴 탐지에 강하고, Codex Security는 인간 보안 연구자가 발견하는 맥락 의존적 취약점에 강하다”고 구분하고 있습니다. 완전히 다른 구간을 담당하는 도구로 보는 게 맞습니다.

▲ 목차로 돌아가기

마치며

Codex Security를 두고 “AI가 보안 팀을 대체한다”는 식의 해석이 많습니다. 근데 실제 공식 문서를 읽으면 반대입니다. 이 도구가 노리는 구간은 보안 팀이 하루의 상당 시간을 쏟아붓는 곳, 즉 “이게 진짜 위협인가 아닌가를 판단하는 트리아지” 작업입니다. 그 구간을 자동화해서 남은 인력이 더 복잡한 아키텍처 설계와 전략적 판단에 집중하게 만드는 게 목표입니다.

베타 기간 동안 같은 저장소에서 노이즈가 84% 줄었다는 수치는 단순한 버전업 결과가 아닙니다. 피드백을 통해 위협 모델이 보정되면서 정밀도가 올라가는 구조, 즉 “이 팀은 어떤 위협을 중요하게 보는가”를 학습하는 흐름입니다. 사용할수록 해당 조직의 맥락에 맞게 다듬어지는 도구입니다.

지금은 리서치 프리뷰 단계이고 접근 제한도 있습니다. 하지만 GnuTLS, OpenSSH, Chromium 같은 핵심 인프라에서 실제 CVE를 찾아냈다는 사실은, 이 도구가 “보여주기용”이 아니라는 걸 이미 증명했습니다. 30일 무료 구간이 남아 있다면 한번 써볼 가치가 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI 공식 블로그 — Codex Security: now in research preview (2026.03.06)
  2. OpenAI 공식 블로그 — Why Codex Security Doesn’t Include a SAST Report (2026.03.16)
  3. The Hacker News — OpenAI Codex Security Scanned 1.2 Million Commits (2026.03.07)
  4. SecurityWeek — OpenAI Rolls Out Codex Security Vulnerability Scanner (2026.03.10)
  5. CSO Online — OpenAI says Codex Security found 11,000 high-impact bugs in a month (2026.03.09)

본 포스팅은 2026년 3월 22일 기준으로 작성됐습니다. OpenAI Codex Security는 현재 리서치 프리뷰 단계이며, 서비스 정책·사용 요금·기능·접근 범위가 정식 출시 시점에 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으며, 최신 내용은 공식 OpenAI 블로그에서 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기