2026.03.31 기준
IT/AI
Anthropic 공식 인정

Claude Mythos, 위험하다는 모델이
공개된 진짜 경위

Anthropic이 아직 공개할 준비가 안 됐다고 판단했던 차세대 AI 모델이 외부에 알려졌습니다. 해킹이 아닙니다. CMS 설정 버튼 하나가 잘못 놓인 것이 전부였습니다. 그리고 유출된 문서 안에는 Anthropic 스스로 “역대 가장 강력하고, 사이버보안 측면에서 전례 없는 위험을 초래할 수 있다”고 적은 문장이 있었습니다.

~3,000개

유출된 Anthropic 내부 문서 수
(출처: Fortune, 2026.03.26)

Capybara

Mythos의 또 다른 이름 후보
(출처: The Decoder, 2026.03.27)

“step change”

Anthropic 공식 대변인 표현
(출처: Fortune, 2026.03.26)

어떻게 유출됐나 — 해킹이 아니었습니다

Anthropic은 외부의 해킹 공격을 받은 게 아닙니다. 2026년 3월 26일, Fortune이 Cambridge 대학의 사이버보안 연구자 Alexandre Pauwels와 LayerX Security의 시니어 AI 보안 연구자 Roy Paz의 제보를 바탕으로 최초 보도했습니다. 두 사람이 발견한 건 Anthropic의 CMS(콘텐츠 관리 시스템)에서 파일이 업로드될 때 기본값이 “공개(public)”로 설정돼 있었다는 점입니다. (출처: Fortune, 2026.03.26)

CMS에 올라간 파일은 누군가 명시적으로 “비공개”로 바꾸지 않는 한, URL만 알면 누구나 열람할 수 있는 공개 데이터 레이크에 그대로 남았습니다. 미발표 블로그 초안, 내부 PDF, 이미지 파일 등 약 3,000개가 그렇게 쌓여 있었습니다. Anthropic은 Fortune의 통보를 받은 후 당일 해당 데이터 저장소를 비공개로 전환했습니다. 이 사고에 AI 도구나 Claude는 관여되지 않았다고 Anthropic은 밝혔습니다. (출처: Fortune, 2026.03.26)

아이러니한 점이 있습니다. Anthropic 대변인은 이 사고가 “external CMS tool의 human error”라고 했는데, 그 도구가 기본 공개 설정을 했다는 사실 자체가 AI 보안 리스크에 대한 가이드라인을 가장 정교하게 만들고 있는 회사에서 발생했다는 점입니다. 이게 제가 이 사건을 단순한 유출이 아니라 주목해야 할 이유로 본 이유입니다.

▲ 목차로 돌아가기

Mythos는 무엇인가 — 유출 문서의 핵심 내용

유출된 미발표 블로그 초안에는 이런 문장이 있습니다. “We have finished training a new AI model: Claude Mythos.” 그리고 곧바로 이어집니다. “by far the most powerful AI model we’ve ever developed.” (출처: Fortune / The Decoder, 2026.03.26~27)

“Compared to our previous best model, Claude Opus 4.6, Capybara gets dramatically higher scores on tests of software coding, academic reasoning, and cybersecurity, among others.”

— Anthropic 유출 블로그 초안 (출처: Fortune, 2026.03.26)

Anthropic이 Fortune의 취재에 응하면서 공식 확인한 내용은 이렇습니다. “We’re developing a general purpose model with meaningful advances in reasoning, coding, and cybersecurity. We consider this model a step change and the most capable we’ve built to date.” 현재 소수의 얼리 액세스 고객과 테스트 중입니다. (출처: Fortune, 2026.03.26)

초안에는 모델 출시 전략도 담겼습니다. “현재 서비스하는 데 비용이 매우 많이 들고, 고객 입장에서도 매우 비쌀 것”이라며, 일반 출시 전 효율성을 크게 높이는 작업이 필요하다고 명시했습니다. 이유는 아직 공개되지 않았지만, 모델 크기가 기존 Opus보다 훨씬 크다는 루머와 일치합니다.

▲ 목차로 돌아가기

Capybara와 Mythos가 같은 모델인 이유

💡 유출 초안이 두 가지 버전으로 발견됐는데, 나란히 놓고 보니 이 차이가 핵심이었습니다.

The Decoder의 분석에 따르면, 유출된 초안은 정확히 동일한 내용을 담은 두 버전으로 존재했습니다. 하나는 모델명이 “Mythos”, 다른 하나는 “Capybara”로만 다릅니다. 그런데 Capybara 버전의 제목 및 본문은 Capybara로 바뀌어 있지만, 부제목에는 여전히 “We have finished training a new AI model: Claude Mythos”라고 남아 있었습니다. 편집 도중 일부를 교체하다 만 흔적입니다. (출처: The Decoder, 2026.03.27)

Anthropic이 출시 전 최종 제품명을 고민하고 있었다는 뜻입니다. 두 이름 모두 같은 모델을 가리킵니다. 현재 내부 문서에서 사용된 이름을 기준으로 업계는 ‘Claude Mythos’라고 부르고 있습니다.

초안에 나오는 Capybara에 대한 설명입니다. “Capybara is a new name for a new tier of model: larger and more intelligent than our Opus models — which were, until now, our most powerful.” 현재 Claude의 모델 티어는 Haiku(소형) → Sonnet(중형) → Opus(최고급) 순인데, Mythos/Capybara는 Opus 위에 새로 만들어지는 최상위 티어가 됩니다. 티어 이름 자체가 새로 생긴다는 점이 핵심입니다. 이게 단순 업그레이드가 아닌 이유입니다.

▲ 목차로 돌아가기

현재 모델과 비교했을 때 얼마나 다른가

구체적인 벤치마크 수치는 아직 공개되지 않았습니다. 초안에는 “dramatically higher scores”라는 정성적 표현만 나옵니다. 단, 현재 최고 성능 모델들과의 비교 기준점을 세울 수 있는 공개 수치들이 있습니다.

지표	Claude Mythos	Claude Opus 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-bench (코딩)	“dramatically higher” (초안 주장, 수치 미공개)	80.8% (검증됨)	경쟁적 (sub-벤치마크 차이)	Opus 미만
GPQA Diamond (과학)	“dramatically higher” (초안 주장)	약 73%	약 80%	94.3% (검증됨, 현재 1위)
사이버보안	“far ahead of any other model” (초안 주장)	별도 카테고리로 측정되지 않음
컨텍스트 윈도우	미공개	1M 토큰	128K 토큰	2M 토큰
API 가격	“very expensive” (초안 표현)	$5 / $25 (100만 토큰당 입/출력)	경쟁적	최저 수준

※ Mythos 수치는 유출 초안 기반 주장, 독립 검증 없음 (출처: FindSkill.ai, 2026.03.30 / Fortune, 2026.03.26)

한 가지 분명한 건, 현재 이 표에서 Mythos 열은 숫자가 없다는 점입니다. “dramatically”는 벤치마크 점수가 아닙니다. 독립 테스트가 공개되기 전까지 이 주장은 Anthropic의 자체 평가에 근거한 것입니다.

▲ 목차로 돌아가기

“전례 없는 사이버 위험”이라는 표현은 과장일까

💡 “위험한 AI 모델”이 나온 게 아니라, 이미 있던 위험을 Anthropic이 처음으로 숫자로 정리해서 보여준 것에 가깝습니다. 공식 발표문과 실제 사건 흐름을 같이 놓고 보니 이런 차이가 보였습니다.

2025년 11월, Anthropic은 GTG-1002라는 중국 국가 연계 해킹 그룹이 이미 공개된 Claude를 이용해 약 30개 기관(기술 기업·금융기관·정부기관)을 대상으로 조율된 사이버 공격을 수행했다고 공개했습니다. AI가 전체 전술 실행의 80~90%를 자율적으로 담당했습니다. (출처: Anthropic Misuse Report, 2025.11 / Fox Business, 2025.11.14)

그리고 2026년 2월, Anthropic의 Frontier Red Team은 이미 출시된 Claude Opus 4.6이 특별한 추가 설정 없이도 오픈소스 코드베이스에서 500개 이상의 고위험 제로데이 취약점을 발견했다는 연구를 발표했습니다. 그중 일부는 수십 년간 전문가 검토와 수백만 시간의 퍼저(fuzzer) CPU를 통과한 코드에 숨어 있던 것들이었습니다. (출처: Anthropic Frontier Red Team, 2026.02.05)

수치가 의미하는 것

Opus 4.6은 이미 공개된 모델인데도 500개 제로데이를 찾았습니다. 이 맥락에서 Mythos가 “사이버 능력에서 다른 어떤 모델보다 훨씬 앞서 있다”고 하면, 그 위험은 수치가 공개되기 전에도 이미 임박한 문제였습니다.

Security Boulevard의 분석은 이 프레임을 정면으로 뒤집습니다. 기반 모델의 능력보다 그 모델을 감싸는 ‘스캐폴딩(scaffolding)’이 실제 위험 수준을 결정한다는 겁니다. DARPA의 AI Cyber Challenge에서 2025년 4개 오픈소스 사이버 추론 시스템이 실제 프로덕션 소프트웨어에서 18개의 실제 취약점(그중 6개는 신규 제로데이)을 발견했는데, 이때 사용된 기반 모델은 상용 모델이었습니다. 취약점 1건당 평균 비용은 152달러였습니다. (출처: DARPA AIxCC / MeriTalk, 2025)

요약하면, “Mythos가 전례 없는 위험”이라는 표현은 틀리지 않지만, 그 위험이 Mythos가 처음 만든 건 아닙니다. Opus 4.6 수준에서도 이미 발생하고 있었고, 그 사실을 Anthropic 자신이 증거로 남겼습니다.

▲ 목차로 돌아가기

출시 전략과 지금 당장 쓸 수 있는가

결론부터 말씀드리면, 지금은 쓸 수 없습니다. 유출 초안에 따르면 Mythos는 현재 사이버 방어 목적의 얼리 액세스 조직에만 Claude API를 통해 제한 배포 중입니다. “일반 출시 전 효율을 크게 높여야 한다”고 명시했기 때문에, 일반 출시 시점이 언제인지는 Anthropic이 공식적으로 답변을 내놓지 않은 상황입니다.

가격에 대해서는 유출 초안이 “very expensive for us to serve, and will be very expensive for our customers to use”라고만 적었습니다. FindSkill.ai의 추정(추정)에 따르면 Capybara/Mythos의 API 가격은 입력 $10~15, 출력 $50~75 (100만 토큰당) 수준으로, 구독 요금제는 월 $300~500 정도가 될 수 있습니다. 다만 이는 추정이며 공식 가격은 미공개 상태입니다. (출처: FindSkill.ai, 2026.03.30)

⚠️ 참고 — OpenAI도 비슷한 시기 움직이고 있습니다

The Decoder에 따르면, OpenAI도 내부적으로 “Spud”라는 코드명의 새 모델을 준비 중이며 사전 훈련을 완료했다고 합니다. 두 회사 모두 연내 IPO를 앞두고 가장 강력한 모델 출시 시점을 조율하고 있다는 분석이 있습니다. (출처: The Decoder, 2026.03.27)

Anthropic의 RSP(책임 있는 스케일링 정책) Version 3.0은 2026년 2월 24일 발효됐습니다. Frontier Safety Roadmap과 Risk Report를 공개하는 체계를 도입했고, Claude Opus 4.6에 대해 AI R&D-4 임계값을 초과하지 않는다고 판단했습니다. Mythos가 이 임계값을 초과할 경우, RSP에 따라 Anthropic은 더 높은 수준의 안전 보고 의무가 발생합니다. (출처: Anthropic RSP, 2026.03.24 업데이트)

▲ 목차로 돌아가기

자주 묻는 질문 (Q&A)

Q. Claude Mythos는 지금 사용할 수 있나요?

아닙니다. 2026년 3월 31일 현재, Mythos는 사이버 방어 목적의 조직을 대상으로 한 얼리 액세스 테스트 단계에 있습니다. 일반 Claude.ai 사용자나 API 사용자는 접근할 수 없습니다. 일반 출시 일정은 Anthropic이 공식 발표를 내놓지 않은 상태입니다.

Q. Mythos와 Capybara는 다른 모델인가요?

같은 모델의 두 이름 후보입니다. 유출된 블로그 초안이 두 버전으로 발견됐는데, 본문 교체가 불완전해서 Capybara 버전에도 “Claude Mythos”라는 이름이 부제목에 남아 있었습니다. Anthropic이 최종 제품명을 아직 결정하지 않은 것으로 보입니다. (출처: The Decoder, 2026.03.27)

Q. 왜 Anthropic은 모델을 보안 조직에만 먼저 배포하나요?

유출 초안에 따르면, Mythos가 기존 어느 AI 모델보다 사이버 공격 능력에서 월등히 앞서 있다고 Anthropic 스스로 평가했기 때문입니다. 방어자들이 먼저 대비 태세를 갖출 수 있도록 사이버 방어 조직에 헤드스타트를 주는 방식으로 출시 전략을 세웠습니다. 이를 “releasing it in early access to organizations, giving them a head start”라고 초안에 명시했습니다.

Q. Mythos가 GPT-5.4나 Gemini 3.1 Pro보다 낫다는 증거가 있나요?

지금은 없습니다. 유출된 초안에는 “dramatically higher scores”라는 정성적 표현만 있고, 공개 벤치마크 수치가 없습니다. 독립적인 연구자나 기관이 Mythos를 테스트한 결과도 공개된 것이 없습니다. GPT-5.4, Gemini 3.1 Pro는 지금 당장 쓸 수 있는 검증된 모델이고, Mythos는 아직 주장 단계입니다.

Q. 유출 사고가 Anthropic에 주는 시사점은 무엇인가요?

AI 보안의 가장 정교한 가이드라인을 만드는 회사가 CMS 기본 설정을 실수했다는 점은 역설적입니다. Fortune이 보도한 것처럼, AI 코딩 도구(Claude Code, Codex 등)가 공개 접근 가능한 데이터 저장소를 자동으로 크롤링하고 패턴을 찾아내는 것을 더 쉽게 만들고 있어, 이런 설정 실수의 노출 가능성이 높아지고 있습니다. 보안 설정의 기본값 관리가 기업 AI 도구의 중요한 리스크 포인트가 됐습니다.

▲ 목차로 돌아가기

마치며 — 이 사건이 남기는 것

Claude Mythos 유출 사건에서 진짜 주목해야 할 포인트는 모델의 성능이 아닙니다. 벤치마크 수치가 없는 지금, “역대 최강”이라는 주장은 검증되지 않은 자체 평가입니다. 실제로 주목할 만한 건 두 가지입니다.

첫 번째는 유출 방식입니다. 3,000개의 내부 문서가 노출된 원인이 해킹도, 내부자 유출도 아니라 CMS 기본 설정이라는 점은, AI 보안 프레임워크를 아무리 정교하게 만들어도 인프라 기본기가 흔들리면 의미가 없다는 걸 보여줍니다. Anthropic 스스로가 이 사례가 됐습니다.

두 번째는 타이밍입니다. Opus 4.6이 이미 500개 제로데이를 찾고, 중국 국가 연계 그룹이 이미 Claude로 30개 기관을 공격한 상태에서 나온 “전례 없는 위험”이라는 표현은 — 솔직히 말하면 — 전례가 있습니다. 차이는 규모와 속도입니다. Mythos가 그 속도를 얼마나 더 높이는지가 실제로 중요한 질문입니다. 그리고 그 답은 아직 누구도 모릅니다.

지금 당장 써야 할 실무가 있다면, Mythos를 기다릴 이유는 없습니다. SWE-bench 80.8%를 기록한 Opus 4.6, GPQA Diamond 94.3%의 Gemini 3.1 Pro는 이미 쓸 수 있습니다. Mythos가 정말로 “dramatically higher”인지는 독립 벤치마크가 나와야 알 수 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Fortune — Anthropic acknowledges testing new AI model (step change 공식 확인)
fortune.com/2026/03/26/anthropic-says-testing-mythos…
Fortune — Anthropic data leak original report (유출 경위 상세)
fortune.com/2026/03/26/anthropic-leaked-unreleased-model…
The Decoder — Mythos/Capybara 두 버전 분석
the-decoder.com/anthropic-leak-reveals-new-model-claude-mythos…
Anthropic — Responsible Scaling Policy (2026.03.24 업데이트)
anthropic.com/responsible-scaling-policy
Security Boulevard / Suzu Labs — 스캐폴딩이 진짜 변수라는 분석
securityboulevard.com/2026/03/claude-mythos-and-the-cybersecurity-risk…
FindSkill.ai — Mythos vs GPT-5.4 vs Gemini 3.1 Pro 비교 분석
findskill.ai/blog/claude-mythos-vs-gpt-54-vs-gemini/

※ 본 포스팅은 2026년 3월 31일 기준으로 작성된 정보를 담고 있습니다. Claude Mythos(Capybara)는 미공개 상태이며, 본문에 인용된 성능·가격 관련 수치는 유출 초안 및 업계 추정치를 포함합니다. 실제 출시 시 공식 발표 내용과 다를 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.

Claude Mythos, 위험하다는 모델이
공개된 진짜 경위

어떻게 유출됐나 — 해킹이 아니었습니다

Mythos는 무엇인가 — 유출 문서의 핵심 내용

Capybara와 Mythos가 같은 모델인 이유

현재 모델과 비교했을 때 얼마나 다른가

“전례 없는 사이버 위험”이라는 표현은 과장일까

출시 전략과 지금 당장 쓸 수 있는가

자주 묻는 질문 (Q&A)

마치며 — 이 사건이 남기는 것

본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

Claude Mythos, 위험하다는 모델이 공개된 진짜 경위

Claude Mythos, 위험하다는 모델이공개된 진짜 경위

어떻게 유출됐나 — 해킹이 아니었습니다

Mythos는 무엇인가 — 유출 문서의 핵심 내용

Capybara와 Mythos가 같은 모델인 이유

현재 모델과 비교했을 때 얼마나 다른가

“전례 없는 사이버 위험”이라는 표현은 과장일까

출시 전략과 지금 당장 쓸 수 있는가

자주 묻는 질문 (Q&A)

마치며 — 이 사건이 남기는 것

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

Claude Mythos, 위험하다는 모델이
공개된 진짜 경위