Fortune 최초 보도
공식 유출 확인
Claude Mythos 유출 —
공식 문서로 확인한 진짜 의미
Anthropic이 CMS 실수 한 번으로 스스로 꺼낸 카드.
유출 문서에는 “전례 없는 사이버보안 위협”이 적혀 있었습니다.
유출은 어떻게 일어났나 — CMS 기본값의 함정
2026년 3월 26일, Fortune이 보도하면서 세상에 알려졌습니다. Anthropic이 사용하는 외부 콘텐츠 관리 시스템(CMS)은 파일을 업로드하면 기본값으로 공개 URL이 붙습니다. 담당자가 ‘비공개’ 설정을 별도로 켜지 않으면 누구나 검색으로 접근할 수 있는 상태가 됩니다. (출처: Fortune, 2026.03.26)
LayerX Security의 시니어 AI 보안 연구원 Roy Paz와 케임브리지대학 사이버보안 연구원 Alexandre Pauwels가 이 캐시를 발견했고, Fortune이 Anthropic에 확인을 요청한 뒤 회사는 데이터베이스에 대한 외부 접근을 차단했습니다. 두 연구원이 검토한 결과, 약 3,000개의 내부 자산이 노출돼 있었습니다. 블로그 이미지, 배너, 로고처럼 사소한 것도 있었지만, 미공개 모델 발표 초안도 그 안에 섞여 있었습니다.
Anthropic은 성명을 통해 “CMS 도구 설정 관련 인적 오류”라고 인정했습니다. 이 초안에는 두 가지 버전이 있었는데, 하나는 모델명이 ‘Mythos’, 다른 하나는 ‘Capybara’였습니다. 두 문서의 부제목에는 공통적으로 “We have finished training a new AI model: Claude Mythos”라는 문장이 남아 있었습니다. (출처: The Decoder, 2026.03.27)
💡 공식 발표문과 실제 유출 경위를 같이 놓고 보니 이런 차이가 보였습니다. “Capybara”라는 이름은 아직 모델명이 확정되지 않았다는 신호입니다. Anthropic은 이름 두 개를 동시에 검토하는 단계였고, 어느 쪽이 최종 출시명이 될지는 아직 공개되지 않았습니다.
Mythos가 Opus 4.6과 다른 이유
Anthropic의 현재 모델 체계는 Haiku → Sonnet → Opus 순으로 크기와 성능이 올라갑니다. 그런데 유출된 초안에는 이 위에 새로운 티어가 생긴다는 내용이 담겨 있었습니다. 초안은 이렇게 씁니다: “Capybara is a new name for a new tier of model: larger and more intelligent than our Opus models — which were, until now, our most powerful.” (출처: Fortune, 2026.03.26)
Opus가 최상위가 아닌 시대가 온다는 뜻입니다. 실제 수치도 초안에 포함됐습니다. “Compared to our previous best model, Claude Opus 4.6, Capybara gets dramatically higher scores on tests of software coding, academic reasoning, and cybersecurity, among others.” 구체적인 수치는 초안에 없었지만, Anthropic 대변인은 Fortune에 “step change”이자 “the most capable we’ve built to date”라고 직접 확인했습니다. 모델 훈련이 이미 완료됐다는 점도 함께 밝혔습니다.
| 모델 티어 | 위치 | 비고 |
|---|---|---|
| Capybara (Mythos) | Opus 상위 신규 티어 | 훈련 완료, 출시 미정 |
| Claude Opus 4.6 | 기존 최상위 | 2026.02 출시 |
| Claude Sonnet 4.6 | 중간 티어 | 현재 기본 모델 |
| Claude Haiku | 경량 티어 | 속도·비용 최적화 |
초안은 또 하나의 중요한 사실을 담고 있었습니다. 모델이 “매우 비싸다”는 것입니다. “The model is expensive to run and not yet ready for general release”라고 돼 있었고, Anthropic은 일반 출시 전 효율성을 높이는 작업이 필요하다고 밝혔습니다. 그러니까 지금 당장은 선택된 얼리 액세스 고객사만 API를 통해 테스트하는 단계입니다.
“전례 없는 사이버보안 위협”이 뜻하는 것
유출된 초안에서 가장 눈에 띄는 표현은 “unprecedented cybersecurity risks”입니다. 좋게 성능을 홍보하는 글에서 스스로 위험을 전면에 내세우는 건 흔한 일이 아닙니다. 초안은 구체적으로 이렇게 씁니다: “The model is currently far ahead of any other AI model in cyber capabilities, and it presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders.”(출처: Fortune, 2026.03.26)
풀어쓰면, 방어자가 막는 속도보다 공격자가 취약점을 찾는 속도가 더 빨라진다는 얘기입니다. 그래서 Anthropic은 얼리 액세스 단계를 사이버 방어 조직 중심으로 구성했습니다. “We’re releasing it in early access to organizations, giving them a head start in improving the robustness of their codebases against the impending wave of AI-driven exploits.” 공격 도구를 먼저 방어자에게 쥐여주겠다는 전략이지만, 방어자가 아닌 쪽에 이 도구가 쥐어지면 어떻게 되는지는 초안이 직접 경고하고 있습니다.
⚠️ 실제 선례가 있습니다
Anthropic은 2025년 11월 공식 블로그에서 중국 국가 후원 해킹 그룹이 이미 Claude Code를 이용해 약 30개 글로벌 조직(테크 기업, 금융사, 정부기관 포함)에 침투 시도를 한 사실을 공개했습니다. Anthropic이 탐지 후 10일간 조사하고 계정을 차단했지만, 일부 사례는 성공했다고 밝혔습니다. (출처: Anthropic 공식 블로그, 2025.11)
이 선례를 보면 Mythos 수준의 사이버 능력이 일반 출시됐을 때의 리스크가 왜 초안에서 강조됐는지 맥락이 잡힙니다. Claude Code로도 이미 국가 단위 공격 시도가 있었는데, Opus 4.6을 “극적으로” 뛰어넘는 모델이 무분별하게 풀리면 상황이 달라집니다.
RSP v3.0 발표 30일 후 유출 — 타이밍이 말해주는 것
Anthropic은 2026년 2월 24일 Responsible Scaling Policy(RSP) 3.0을 발표했습니다. (출처: Anthropic, 2026.02.24) 이 개정의 가장 큰 변화는 두 가지입니다. 첫째, 위험 수준을 충족하지 못하면 개발을 일시 정지하겠다는 ‘포즈 공약(pause commitment)’이 삭제됐습니다. 둘째, ASL-4 수준에 해당하는 기준이 ‘업계 전체 권고사항’으로 격하됐고, 구체적인 정의는 여전히 확정되지 않은 상태입니다. (출처: GovAI RSP v3.0 분석, 2026.03.05)
💡 유출 내용과 RSP v3.0 변화를 함께 놓고 보면 이런 그림이 나옵니다. Mythos는 유출 문서가 “전례 없는 사이버보안 위협”이라고 표현한 모델입니다. ASL-4 수준에 해당할 가능성이 높지만, RSP v3.0은 ASL-4를 구체적으로 정의하지 않았습니다. 즉, 이론상 Mythos가 ASL-4에 해당하더라도 현재 체계에서는 적용할 명확한 관리 기준이 없는 상태입니다.
GovAI(Centre for the Governance of AI) 분석에 따르면 RSP v3.0에서 “ASL-4 Deployment and Security Standards”에 대한 참조가 사라졌고, 이 기준은 이전에도 명확히 정의된 적이 없었습니다. Anthropic은 이를 “미래 능력 수준에 대한 지나치게 경직된 기준 설정을 피하기 위한 것”이라고 설명했습니다. 포즈 공약을 삭제한 이유도 비슷합니다. 경쟁사들이 동참하지 않는 상황에서 혼자 멈추면 오히려 ‘덜 안전한 주체’가 선두에 서게 된다는 논리입니다.
이 논리 자체는 일리가 있습니다. 그러나 RSP v3.0 발표 정확히 30일 후, 스스로 “ASL-4 수준일 수 있는” 모델의 존재가 공개됐다는 점은 그 타이밍 자체가 아이러니합니다. 안전 기준의 완화와 역대 최강 모델의 (의도치 않은) 공개가 같은 달 안에 일어났습니다.
보안주가 9% 빠진 이유, 수치로 확인했습니다
유출 다음 날인 3월 27일, 사이버보안 관련 주식이 일제히 하락했습니다. CrowdStrike, Palo Alto Networks, Zscaler, SentinelOne, Okta, Tenable 등이 단일 세션에서 4.5%~9% 빠졌습니다. (출처: CNBC, 2026.03.27; AI.GoPubby 분석, 2026.03.29)
이게 왜 문제냐면, 이 회사들의 제품이 ‘사람이 찾기 어려운 취약점을 발견해 준다’는 가치를 파는 비즈니스이기 때문입니다. Mythos처럼 “방어자의 속도를 넘어서는” AI가 나오면, 역설적으로 방어 솔루션의 가치가 하락하는 게 아니라 — 공격 도구가 훨씬 빨라지는 쪽으로 균형이 깨집니다. 기존 방어 솔루션이 대응할 수 없는 수준의 공격이 늘어날 수 있다는 우려가 주가에 반영된 것입니다.
💡 보안주 폭락은 단순 심리 반응이 아닙니다. 같은 시기 OpenAI도 GPT-5.3-Codex를 “사이버 작업에서 고능력 최초 분류”로 발표했습니다. (출처: Fortune, 2026.02.05) 한 회사의 모델이 아니라 업계 전반이 같은 방향으로 이동하고 있다는 신호를 시장이 읽은 것입니다.
비교 수치를 직접 확인할 수 있는 지점이 하나 더 있습니다. Claude Opus 4.6은 2026년 2월 출시 당시, Anthropic이 “프로덕션 코드베이스에서 미발견 취약점을 찾는 능력”이 있다고 공식 인정하며 “양날의 검”이라고 표현했습니다. Mythos는 그 Opus 4.6을 “극적으로(dramatically)” 넘어서는 모델입니다. 정성적 표현이지만, ‘극적’이라는 단어를 공식 문서에서 쓰는 것은 드문 일입니다.
Mythos, 지금 쓸 수 있나요
결론부터 말씀드리면, 2026년 3월 31일 기준으로 일반 사용은 불가능합니다. 유출 초안과 Anthropic 공식 발표 모두 “소수 얼리 액세스 고객과 테스트 중”이라고 밝히고 있습니다. 사이버 방어 조직을 우선 대상으로 하며, Claude API를 통한 접근도 초기에는 제한적으로 확대될 예정입니다.
초안은 모델이 아직 “매우 비싸다”는 점도 명시했습니다. 일반 출시 전 효율화 작업이 필요하다는 의미입니다. 정식 출시 시기는 아직 공개되지 않았고, Anthropic이 Q4 2026 IPO를 목표로 한다는 보도도 있어 출시 일정이 이와 연동될 가능성을 배제하기 어렵습니다. (출처: The Tech Portal, 2026.03.27 — 추정, Anthropic 공식 확인 없음)
개발자 입장에서 지금 할 수 있는 것은, Anthropic의 Safety Bug Bounty 프로그램을 주시하는 것입니다. 유출 시점과 같은 날(2026.03.26) 발표된 이 프로그램은 Mythos 수준의 모델이 가져올 사이버 리스크에 대한 Anthropic의 준비 작업이기도 합니다. Mythos 얼리 액세스 대상에 포함되려면 이쪽 커뮤니티가 가장 빠른 경로일 수 있습니다.
자주 묻는 질문
마치며 — 가장 안전을 강조하던 회사가 보낸 신호
Anthropic은 AI 안전을 회사의 정체성으로 내세워 왔습니다. RSP를 가장 먼저 만든 회사이기도 합니다. 그런데 이번 달 안에 두 가지 일이 동시에 일어났습니다. 하나는 포즈 공약을 뺀 RSP v3.0 발표, 다른 하나는 “전례 없는 사이버 위협”을 가진 모델의 의도치 않은 공개입니다.
이걸 보고 Anthropic을 비난하는 건 너무 단순한 접근입니다. 경쟁사가 멈추지 않는 상황에서 혼자 멈추는 것이 현실적으로 어렵다는 점, 그리고 오히려 방어 조직에게 먼저 접근권을 주겠다는 전략은 그나마 합리적인 대응입니다. 다만 그 전략이 제대로 작동하려면 ASL-4 기준이 명확히 정의돼야 하고, 얼리 액세스 대상 선정이 투명해야 합니다. 두 가지 모두 아직 Anthropic이 공개한 내용이 없습니다.
Mythos가 언제 일반 출시될지, 최종 이름이 뭐가 될지는 아직 모릅니다. 그러나 훈련이 완료됐다는 건 확인됐습니다. 앞으로 몇 달 안에 어떤 형태로든 움직임이 있을 것이고, 그때 이 유출 문서의 경고 문구들이 실제로 어느 정도였는지 판단할 수 있게 됩니다.
본 포스팅 참고 자료
- Fortune — Anthropic confirms Claude Mythos existence: fortune.com (2026.03.26)
- The Decoder — Anthropic leak reveals new model Claude Mythos: the-decoder.com (2026.03.27)
- GovAI — Anthropic’s RSP v3.0 분석: governance.ai (2026.03.05)
- CoinDesk — Anthropic most powerful AI model leaked: coindesk.com (2026.03.28)
- Futurism — Anthropic step-change new model: futurism.com (2026.03.26)
- Anthropic 공식 RSP v3.0 PDF: anthropic.com (2026.02.24)
본 포스팅은 2026년 3월 31일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Anthropic의 모델 출시 일정, 요금, 기능은 공식 발표에 따라 달라집니다. 본 포스팅에 인용된 초안 문서는 Anthropic이 “early drafts of content considered for publication”으로 공식 인정했으며, 최종 출시 내용과 다를 수 있습니다.











댓글 남기기