IT/AI
Claude Mythos, 보안 경고가 붙은 이유가 있습니다
Anthropic의 차세대 모델 Claude Mythos(코드명 Capybara)가 출시 발표 전에 먼저 세상에 알려졌습니다. 2026년 3월 26일, Fortune이 Anthropic의 CMS 설정 오류로 공개된 초안 문서를 발견하면서입니다. 유출 직후 사이버보안 관련 주식이 급락했고, Anthropic 대변인은 “지금까지 개발한 것 중 단연 가장 강력한 모델”이라고 확인했습니다. 발표 전에 경고부터 나온 AI — 왜 그런지 공식 문서를 기반으로 따져봤습니다.
어떻게 유출됐나 — CMS 설정 오류 한 줄의 파장
2026년 3월 26일 목요일, Fortune의 기자 Beatrice Nolan이 Anthropic의 콘텐츠 관리 시스템(CMS)에서 공개 검색이 가능한 상태로 방치된 대규모 데이터 저장소를 발견했습니다. Cambridge 대학 사이버보안 연구원 Alexandre Pauwels가 검토한 결과, 약 3,000개에 달하는 미공개 자산(이미지, PDF, 음성 파일, 초안 블로그 글)이 인증 없이 누구나 접근 가능한 URL에 노출되어 있었습니다. (출처: Fortune, 2026.03.26)
💡 CMS 기본 설정의 허점: 해당 시스템은 디지털 자산을 업로드할 때 ‘공개’가 기본값이었습니다. 담당자가 별도로 ‘비공개’로 바꾸지 않으면 자동으로 공개 URL이 생성됩니다. Anthropic은 “외부 CMS 도구의 설정 문제로 초안 콘텐츠가 접근 가능하게 됐으며, 이는 인적 오류에 의한 것”이라고 Fortune에 공식 확인했습니다. (출처: Fortune, 2026.03.26) 보안 솔루션이 아니라 클릭 한 번의 실수가 이 모든 상황을 만들었다는 뜻입니다.
Fortune이 Anthropic에 유출 사실을 통보한 목요일 저녁 이후, Anthropic은 해당 데이터 저장소의 공개 검색 기능을 차단했습니다. 그러나 유출 문서는 이미 보안 포럼과 SNS를 통해 확산된 뒤였습니다. 눈여겨볼 점은, AI 안전을 가장 강조하는 회사로 알려진 Anthropic이 정작 자사 내부 문서 보안에서 이런 기본적인 실수를 저질렀다는 사실입니다.
Capybara는 뭔가 — Opus 위에 새 층이 생겼습니다
유출 문서에서 가장 주목할 내용은 모델 이름이 아니라 모델 계층 구조의 변화입니다. 지금까지 Anthropic의 모델 라인업은 크기 순으로 Opus(최상위) → Sonnet → Haiku였습니다. 그런데 초안 블로그에는 이런 문장이 있습니다:
“Capybara는 새로운 모델 계층의 이름입니다: 현재까지 우리의 가장 강력한 모델이었던 Opus보다 더 크고 더 지능적입니다.”
(출처: Fortune이 검토한 Anthropic 유출 초안, 2026.03.26)
즉, Mythos는 “Opus 5″가 아닙니다. Opus를 대체하는 것이 아니라, Opus 위에 새로운 최상위 계층인 Capybara가 신설되고, 그 계층의 첫 번째 모델이 Claude Mythos입니다. 이 구분은 중요합니다 — 성능이 좋아진 게 아니라 아예 다른 레벨의 모델이라는 뜻이기 때문입니다.
| 계층 | 현행 모델 | 특징 | 상태 |
|---|---|---|---|
| Capybara (신설) | Claude Mythos | Opus보다 크고 더 강력, 고비용 | 얼리액세스 |
| Opus | Claude Opus 4.6 | 현재 공개 최상위, 코딩·에이전트 특화 | 정식 출시 |
| Sonnet | Claude Sonnet 4.6 | 속도·비용 균형 | 정식 출시 |
| Haiku | Claude Haiku 4.5 | 최경량·최저가 | 정식 출시 |
Anthropic은 “추론, 코딩, 사이버보안 분야에서 의미 있는 발전을 이룬 범용 모델을 개발 중”이라고 공식 확인했습니다. 유출 초안에는 현재 최상위 모델인 Claude Opus 4.6과 비교해 소프트웨어 코딩, 학술 추론, 사이버보안 벤치마크에서 “극적으로 높은 점수”를 기록했다는 문구가 있습니다. 단, 구체적인 벤치마크 수치는 공식 발표 전까지 확인할 수 없는 상태입니다.
사이버보안 주가 왜 떨어졌나 — 수치로 본 시장 반응
유출 소식이 퍼진 2026년 3월 27일(금요일), 미국 사이버보안 관련 주식들이 일제히 급락했습니다. CNBC 보도에 따르면 iShares Cybersecurity ETF가 4.5% 하락했고, CrowdStrike·Palo Alto Networks·Zscaler·SentinelOne이 각각 6% 하락했습니다. 낙폭이 가장 컸던 것은 Tenable로 9% 급락했습니다. (출처: Indian Express, Fortune, 2026.03.27)
💡 이 수치가 말하는 것: 보통 AI 기업의 새 모델 발표는 사이버보안 업계의 수요를 키워야 정상입니다. 그런데 이번엔 반대였습니다. 시장이 읽은 메시지는 “Mythos가 사이버 공격 도구로 쓰이면 기존 보안 제품들이 방어하지 못할 수 있다”는 것입니다. AI가 공격자의 손에 들어갔을 때의 속도를 기존 보안 솔루션이 따라가지 못한다는 전제가 주가에 반영된 셈입니다.
같은 날 Bitcoin도 $66,000선까지 하락했습니다. AI 기반 사이버 공격 리스크가 암호화폐 거래소와 지갑 인프라까지 위협할 수 있다는 공포가 반영된 것으로 분석됩니다. 단순한 기술 뉴스가 금융 시장 전반에 파장을 일으킨 배경에는, 유출 문서가 단순한 성능 홍보가 아닌 “리스크 경고문”에 가까운 내용을 담고 있었다는 점이 있습니다.
Anthropic이 스스로 경고한 리스크 — 문서에 딱 이렇게 나옵니다
많은 AI 회사들이 새 모델 발표 시 “안전하게 개발했다”는 식의 보증 멘트를 냅니다. 그런데 Mythos 초안은 달랐습니다. 내부 문서에 직접 이런 문장이 들어 있었습니다:
“(Claude Mythos는) 사이버 역량 면에서 다른 어떤 AI 모델보다 훨씬 앞서 있으며, 방어자들의 노력을 훨씬 능가하는 방식으로 취약점을 악용할 수 있는 모델들의 물결을 예고합니다.”
(출처: Fortune이 검토한 Anthropic 유출 초안, 2026.03.26)
자사 제품의 공식 발표 초안에 “방어자를 능가한다”는 문구를 스스로 쓴 회사는 거의 없습니다. 이게 단순한 마케팅 과장이 아니라는 근거도 문서에 있습니다. Anthropic은 이미 2025년 11월, 중국 국가 지원 해킹 그룹이 Claude Code를 활용해 테크기업·금융기관·정부기관을 포함한 약 30개 조직에 침투한 사실을 직접 포착해 차단했다고 밝혔습니다. (출처: Fortune, 2025.11.14) 이 경험이 Mythos의 신중한 출시 전략에 직접적인 영향을 미쳤다는 게 유출 문서의 맥락입니다.
💡 공식 문서와 실제 사례를 나란히 놓고 보면: Anthropic은 “우리 모델이 이미 실제 사이버 공격에 활용됐다”는 사실을 알고 있는 상태에서, 그보다 훨씬 강력한 Mythos를 어떻게 출시할지를 설계했습니다. 경고문이 발표 초안에 들어간 건 자기 홍보가 아니라 자기 기록입니다.
비교 대상도 있습니다. OpenAI는 2026년 2월 GPT-5.3-Codex를 출시하면서 자사 Preparedness Framework 기준 최초로 사이버보안 “고위험 역량” 판정을 받은 모델이라고 밝혔습니다. (출처: Fortune, 2026.02.05) Mythos는 그보다 한 단계 더 나아간 상황을 Anthropic 스스로 내부 문서에 기록한 것입니다.
출시 전략이 이례적인 이유 — 사이버 방어팀 먼저
일반적인 AI 모델 출시는 개발자·기업 고객·일반 소비자 순서로 진행됩니다. Mythos의 계획은 달랐습니다. 유출 문서에는 “우리는 사이버 방어에 집중하는 조직에 먼저 얼리액세스를 제공하고, 곧 닥칠 AI 기반 익스플로잇의 물결에 대비해 코드베이스를 강화할 선제적 기회를 주겠다”는 내용이 포함되어 있습니다.
이 전략은 이중 사용(dual-use) 딜레마에 대한 Anthropic의 현실적인 대응입니다. 소프트웨어 취약점을 찾아내는 능력이 방어자에게는 보안 강화 도구가 되지만, 공격자에게는 자동화된 해킹 툴이 됩니다. Anthropic의 논리는 “방어자가 먼저 이 능력을 확보해야 균형을 맞출 수 있다”는 것입니다.
💡 공식 발표·실제 출시 흐름을 함께 보면 이런 차이가 보입니다: 기존 Opus 4.6 출시 때도 Anthropic은 “방어자와 공격자 모두 쓸 수 있는 이중 사용” 가능성을 언급했습니다. (출처: Fortune, 2026.02.06) 그때는 부록 수준의 경고였다면, Mythos에서는 그게 출시 전략 자체를 규정하는 핵심 원칙이 됐습니다. 같은 회사의 같은 언어인데 비중이 완전히 달라진 것입니다.
Anthropic은 “모델이 비싸고 아직 일반 출시 준비가 안 됐다”는 점도 초안에 명시했습니다. 구체적인 출시 일정은 공개되지 않은 상태입니다. 현재 공개된 최상위 모델은 여전히 Claude Opus 4.6(출시 2026.02.06)과 Claude Sonnet 4.6입니다.
동시에 벌어지고 있는 일들 — Pentagon 제재·IPO·경쟁 구도
Mythos 유출 바로 같은 날인 3월 26일, Anthropic과 관련된 또 다른 큰 뉴스가 터졌습니다. 미국 연방 판사가 트럼프 행정부(Pentagon)가 Anthropic을 “공급망 위험” 기업으로 지정하고 연방 정부 기관의 Claude 사용을 금지한 조치를 일시 정지시켰습니다. 판사는 이 조치가 “오웰적이고 처벌적”이라고 표현했습니다. (출처: Fortune, CNN, Axios, 2026.03.26)
여기에 더해, The Information은 같은 시기 Anthropic이 4분기 IPO를 논의 중이라고 보도했습니다. 세 가지 흐름이 같은 날 겹쳤습니다: 역대 최강 모델 유출, 정부 제재 차단, 기업공개 추진. 이 맥락을 이해하면 Anthropic이 Mythos 출시에 왜 그토록 신중한지가 다르게 보입니다.
경쟁 구도도 흥미롭습니다. 3월 30일, OpenAI는 경쟁사의 Claude Code에 공식 Codex 플러그인을 오픈소스로 출시했습니다. (출처: GitHub openai/codex-plugin-cc, 2026.03.30) 서로의 도구와 생태계를 연결하는 방향으로 가는 것인지, 아니면 점유율 경쟁을 위한 전략인지는 아직 불분명합니다. 한편 The Information은 같은 시기 OpenAI가 “Spud”라는 코드명의 새 모델 사전 학습을 마쳤다고 보도했습니다.
아직 확인되지 않은 것들 — 과장 없이 정리
Anthropic이 Mythos의 존재와 “step change” 수준의 성능을 공식 확인한 것은 사실입니다. 그러나 현재 검증되지 않은 부분도 명확하게 짚어야 합니다.
- 구체적인 벤치마크 수치: “극적으로 높은 점수”라는 표현만 있고, SWE-bench·HumanEval·ARC-AGI 등 구체적 수치는 공개되지 않았습니다. Opus 4.6의 SWE-bench Verified 약 80.8% 대비 얼마나 높은지는 공식 발표 전까지 알 수 없습니다.
- 가격과 컨텍스트 윈도우: API 가격, 최대 출력 토큰, 컨텍스트 크기 모두 미공개입니다.
- 일반 출시 일정: Anthropic은 이유를 명시하지 않은 채 “준비가 안 됐다”는 수준의 언급만 있습니다.
- 일부 UI 목격담: 일부 사용자가 Claude 인터페이스에서 “Mythos 5 (experimental)” 표시를 봤다고 주장합니다. 광범위한 확인은 없는 상태입니다.
⚠️ 커뮤니티에서 도는 “Opus 5″라는 호칭은 공식 명칭이 아닙니다. 유출 문서 기준으로 정확한 명칭은 Claude Mythos(모델 이름)이고, 계층명은 Capybara입니다. 공식 발표 전까지 이 두 이름이 그대로 쓰일지도 확인되지 않았습니다. Anthropic이 공식 답변을 내놓지 않은 부분입니다.
자주 묻는 질문
마치며 — 공식 경고가 담긴 발표 초안이 의미하는 것
솔직히 말하면, AI 모델 유출 소식은 이제 흔합니다. 그런데 Claude Mythos의 경우 다른 점이 있습니다. 유출된 것이 성능 홍보 글이 아니라 “우리 모델이 사이버 방어자를 능가할 수 있다”는 경고를 스스로 문서에 남긴 회사의 초안이라는 점입니다.
Anthropic은 이미 2025년 11월 실제 사이버 공격에 자사 모델이 활용됐다는 사실을 직접 확인하고 차단한 경험이 있습니다. 그 경험 위에서 더 강력한 모델의 출시 전략을 “방어자 먼저”로 설계했다면, 이건 AI 안전 논쟁에서 꽤 무거운 자기 선언입니다.
구체적인 벤치마크 수치, 출시 일정, API 가격은 아직 없습니다. 공식 발표가 나오면 이 글을 업데이트할 예정입니다. 지금 당장 확인할 수 있는 것은 Anthropic 공식 뉴스 페이지와 아래 참고 자료에 링크된 Fortune 원문입니다.
본 포스팅 참고 자료
- Fortune — Anthropic acknowledges testing new AI model (2026.03.26)
- Fortune — Anthropic’s Mythos cybersecurity risk newsletter (2026.03.27)
- Indian Express — What to know about Anthropic’s Claude Mythos (2026.03.28)
- Anthropic 공식 블로그 — Pentagon 공급망 위험 지정 대응 (2026.03.05)
- Investing.com 한국 — 사이버보안 주가 급락 (2026.03.27)
본 포스팅은 2026년 3월 31일 기준으로 작성되었습니다. Anthropic의 서비스 정책·모델명·기능·출시 일정은 공식 발표 이후 변경될 수 있습니다. Claude Mythos에 관한 정보 중 일부는 공식 발표 전 유출된 초안 문서를 기반으로 하며, Anthropic의 공식 발표와 다를 수 있습니다.











댓글 남기기