Claude Mythos / Capybara
유출 확인 2026.03.26
Claude Mythos, 위험하다는 말이 사실일까요?
Anthropic이 “역대 가장 강력한 AI”를 스스로 출시하지 못하고 있습니다. 3월 26일 CMS 오류로 3,000개 내부 문서가 유출됐고, 회사는 곧바로 존재를 인정했습니다. 그런데 막상 내용을 뜯어보니, 위협의 실체는 Mythos 자체가 아니라 훨씬 앞선 시점부터 이미 시작된 이야기였습니다.
유출 사건, 대체 무슨 일이 있었나
Claude Mythos라는 이름이 처음 수면 위로 올라온 건 2026년 3월 26일입니다. 어떤 해킹도, 내부 고발도 아니었습니다. 보안 연구자가 일상적인 웹 검색을 하다가 Anthropic 내부 문서가 검색에 그대로 노출된 것을 발견했습니다. (출처: Fortune, 2026.03.26)
원인은 허탈할 정도로 단순합니다. Anthropic이 사용하는 CMS(콘텐츠 관리 시스템)의 공개/비공개 토글이 잘못된 방향으로 설정되어 있었습니다. 초안 블로그 포스트, PDF, 내부 메모, 임직원 정보, 초청 전용 CEO 행사 자료까지 — 약 3,000개 자산이 인증 없이 누구나 접근 가능한 공개 데이터 레이크에 올라가 있었습니다. Anthropic은 이후 Fortune을 통해 유출이 실제임을 인정했습니다.
공개된 초안 중 하나에 Claude Mythos에 대한 미발행 블로그 글이 있었습니다. 그 글 안에서 Anthropic 스스로 이 모델을 “우리가 지금까지 개발한 것 중 단연코 가장 강력한 AI”라고 표현했고, 대변인은 Fortune에 “AI 성능의 step change”이자 “우리가 만든 것 중 가장 유능한 모델”이라고 확인해줬습니다. (출처: Fortune, 2026.03.26)
💡 공식 확인이 이례적입니다. 통상적으로 유출된 내용은 “확인해줄 수 없다”는 답변이 돌아오는데, Anthropic은 사흘도 안 돼 존재를 인정했습니다. 즉, 이 모델은 이미 훈련이 완료됐고 일부 얼리 액세스 고객이 테스트 중입니다.
Capybara라는 새 티어가 생기는 이유
지금까지 Anthropic의 모델 라인업은 Haiku(경량), Sonnet(중간), Opus(최상위) 세 계층이었습니다. 그런데 유출된 문서에는 Capybara라는 이름의 새로운 티어가 등장합니다. Opus 위에 올라가는 위치, 즉 Anthropic 역사상 가장 크고 가장 똑똑하고 가장 비싼 모델 계층입니다. Claude Mythos가 바로 이 Capybara 티어의 첫 번째 모델입니다. (출처: Mashable, 2026.03.27)
흥미로운 건 네이밍 전략입니다. Anthropic은 지금까지 동물 이름을 코드명으로만 썼고 상용 이름은 Claude + 버전 번호 체계를 유지했습니다. 그런데 이번에는 Mythos라는 상용명과 Capybara라는 내부 티어명을 동시에 사용합니다. “Opus 5″라고 부르지 않는 이유가 있습니다. 단순한 버전 업이 아니라, 기존 계층 체계 자체를 확장하는 구조 변경이라는 신호입니다.
유출 초안은 Mythos가 코딩·학술 추론·사이버보안 벤치마크에서 현재 최상위 모델인 Claude Opus 4.6 대비 “극적으로 높은 점수”를 기록했다고 씁니다. Opus 4.6의 기준 수치로 보자면: SWE-bench Verified 80.8%, GPQA Diamond 91.3%입니다. (출처: Anthropic 공식 블로그 ‘Introducing Claude Opus 4.6’, 2026.02.05) Mythos는 이 수치를 큰 폭으로 뛰어넘는다는 내부 평가인 셈입니다.
| 티어 | 현재 모델 | SWE-bench Verified | API 입력 요금 |
|---|---|---|---|
| Haiku | Claude Haiku 4.6 | — | $0.25/1M 토큰 |
| Sonnet | Claude Sonnet 4.6 | 79.6% | $3/1M 토큰 |
| Opus | Claude Opus 4.6 | 80.8% | $5/1M 토큰 |
| Capybara (신규) | Claude Mythos | 미공개 | 미공개 (Opus 초과 예정) |
※ Sonnet 4.6, Opus 4.6 수치 출처: Anthropic 공식 모델 카드(2026.02). Mythos 수치는 미공개.
Mythos가 실제로 위험한 이유
유출 문서에서 Anthropic이 가장 강하게 우려한 부분은 성능 자체가 아니라 사이버보안 분야의 공격적 활용 가능성입니다. 초안에는 이렇게 적혀 있었습니다: “현재 사이버 능력에서 다른 어떤 AI 모델보다 훨씬 앞서 있으며, 방어자들의 노력을 훨씬 앞지르는 속도로 취약점을 악용할 수 있는 모델의 다음 물결을 예고한다.” (출처: Fortune 독점 보도, Mashable 인용, 2026.03.27)
Anthropic은 이 때문에 출시 전 선제적으로 사이버보안 파트너들에게 얼리 액세스를 제공하고 있습니다. 목적은 “방어자들이 AI 주도 공격의 임박한 물결에 대비해 자신들의 코드베이스 견고성을 개선할 수 있도록 선행 기회를 주기 위함”이라고 유출 초안은 밝힙니다.
또한 유출 자료에는 중국 국가 지원 해킹 그룹이 Claude Code를 이용해 약 30개 기관에 침투를 시도한 사건과의 연결 고리도 언급됩니다. Anthropic은 2025년 11월 이 사건을 공식 발표했는데, 당시 사용한 모델은 Mythos가 아닌 기존 Claude Code였습니다. 즉, Mythos는 이미 실증된 위협의 성능을 한 단계 더 높인 모델입니다. (출처: Anthropic 공식 뉴스 ‘Disrupting the first reported AI-orchestrated cyber espionage campaign’, 2025.11.13)
진짜 위협은 Mythos 이전부터 이미 왔다
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보면, Mythos가 아니라 이미 출시된 모델이 더 직접적인 위협이었다는 점이 보입니다.
대부분의 언론이 “Mythos가 전례 없는 사이버 위협”이라는 프레임으로 보도했지만, 사실관계를 짚고 넘어가면 결론이 달라집니다. Anthropic 자체 Frontier Red Team이 2026년 2월 발표한 보고서에 따르면, Mythos가 아닌 기존 Claude Opus 4.6가 특별한 스캐폴딩 없이도 프로덕션 오픈소스 코드베이스에서 500개 이상의 고위험 제로데이 취약점을 발견했습니다. 그 중 일부는 수십 년간 전문가들의 검토에서도 살아남은 버그였습니다. (출처: Anthropic Frontier Red Team, 2026.02.05)
이것이 왜 중요하냐면 — 현재 누구나 API로 쓸 수 있는 Opus 4.6이 이미 그 수준이라는 뜻입니다. Mythos의 위험성을 강조할수록, 역설적으로 이미 배포된 모델의 위험성이 과소평가되어 온 셈입니다.
시각을 더 넓히면 상황은 더 명확합니다. 2025년 11월 Anthropic이 공개한 GTG-1002 사건(중국 국가 지원 해킹 캠페인)에서 위협 행위자는 Claude Code를 이용해 전체 작전의 80~90%를 AI가 단독으로 수행했고, 인간 개입은 작전당 4~6회 결정 포인트에 그쳤습니다. 공격 속도는 초당 수천 건의 요청, 인간 해커 팀이 내는 속도는 물리적으로 불가능한 수준이었습니다. (출처: Anthropic 공식 뉴스 ‘Disrupting the first reported AI-orchestrated cyber espionage campaign’, 2025.11.13)
보안 전문가들이 더 주목하는 또 다른 사례가 있습니다. 2026년 2월, Amazon Threat Intelligence는 저~중간 수준의 해커 한 명이 상용 AI 서비스를 이용해 38일 만에 55개국 600개 이상의 FortiGate 방화벽을 침해했다는 보고서를 냈습니다. 사용 모델은 Mythos가 아니라 시중에 공개된 일반 AI였습니다. Amazon CTO CJ Moses는 “이 정도 커스텀 툴링의 양과 다양성은 통상 잘 갖춰진 개발팀을 시사하는데, 사실은 AI로 혼자 만든 것”이라고 평했습니다. (출처: Amazon Web Services Security Blog, 2026.02)
Anthropic이 출시를 미루는 진짜 이유
💡 “비용 문제”와 “안전 이슈”가 함께 작동하고 있습니다. 훈련이 끝난 모델을 내놓지 못하는 이유가 두 가지 축으로 나뉜다는 점, 일반적인 AI 출시 지연 서사와 다릅니다.
유출 초안에는 Anthropic이 Mythos를 당장 일반 공개하지 못하는 이유로 두 가지를 언급합니다. 첫째, 규모에 맞게 운영하기엔 비용이 너무 높다는 것. Anthropic은 내부적으로 “scale에서 실행하기엔 너무 비싸다”고 표현했습니다. 즉 현재 형태로는 ChatGPT Plus처럼 월 20~30달러 구독 구조에 포함시키기 어렵다는 뜻입니다. (출처: kotrotsos.medium.com, 2026.03.31)
둘째, 앞서 언급한 사이버보안 위험성입니다. Anthropic은 일반 출시 전 사이버 방어 쪽에 먼저 액세스를 부여해 “임박한 AI 구동 공격 물결에 대비한 방어 준비”를 하려 합니다. 이는 Anthropic의 공식 정책인 Responsible Scaling Policy(RSP)의 ASL-3 이상 임계값과 연결됩니다. RSP 로드맵 페이지(2026.02.22 갱신)에는 현재 Anthropic의 최강 모델들이 “중요 인프라를 심각하게 해칠 수 있는 능력에 접근하는 수준”임을 명시하고 있습니다. (출처: anthropic.com/responsible-scaling-policy/roadmap)
SecurityBoulevard의 분석에 따르면, 여기서 주목할 점은 “모델 자체보다 스캐폴딩(모델 주변의 도구 통합·방법론·실행 하니스)”이 실질적인 공격력을 결정한다는 것입니다. 즉, Mythos를 가두는 것만으로는 위협을 막을 수 없습니다. 저숙련 공격자가 기존 오픈 모델에 좋은 스캐폴딩을 붙여도 비슷한 결과를 낼 수 있기 때문입니다. (출처: SecurityBoulevard/Suzu Labs, 2026.03.30)
언제 나올까 — 출시 전망과 주의점
Anthropic은 Mythos 출시 일정을 공식적으로 발표하지 않았습니다. 유출된 초안 문서에 날짜가 삽입되어 있었다는 보도가 있었지만, Anthropic은 그 일정에 따라 출시할 계획임을 공식적으로 밝히지 않았습니다. (출처: hybridhorizons.substack.com, 2026.03.27)
지금까지 정황을 종합하면 출시 순서는 다음과 같이 예상됩니다. ① 사이버보안 파트너 얼리 액세스(현재 진행 중으로 추정) → ② API 제한 공개 → ③ Claude Pro/Team/Enterprise 구독 단계적 확장. 다만 이 모든 경로와 일정은 Anthropic이 공식 발표를 내놓지 않은 부분입니다.
일부 커뮤니티 사용자들이 Claude 인터페이스에서 “Mythos 5 (experimental)”라는 모델명과 “더 크고 더 지능적”이라는 설명을 봤다는 스크린샷을 공유했습니다. 그러나 이것이 제한 A/B 테스트인지, 내부 테스트 흔적인지, 조작된 이미지인지는 아직 광범위하게 검증되지 않았습니다. 해당 스크린샷이 사실이라는 Anthropic의 공식 답변은 나오지 않은 상태입니다.
현재 공개된 Claude 모델 중 가장 강력한 것은 여전히 Claude Opus 4.6(2026.02.05 출시)와 Claude Sonnet 4.6(2026.02.17 출시)입니다. 두 모델 모두 이미 코딩·추론·에이전트 작업에서 상당한 수준이므로, Mythos를 기다리는 동안 실제 작업에 활용하기에 충분합니다.
자주 나오는 질문 5가지
마치며 — 이 사건이 말하는 것
Claude Mythos 유출 사건에서 진짜 주목할 대목은 모델 성능 수치가 아닙니다. 훈련이 완료된 최강 모델을 가진 회사가 그 모델을 스스로 출시하지 못하고 있다는 사실 자체입니다. Anthropic은 “역대 가장 강력한 AI”를 만들고도, 그것이 너무 위험하다는 걸 누구보다 잘 알기 때문에 다음 단계를 신중하게 밟고 있습니다.
솔직히 말하면, 이 상황이 AI 안전에 대한 Anthropic의 접근이 실제로 작동하고 있다는 신호처럼 보이기도 합니다. 만들어놓고 “너무 위험하니 안 낸다”는 결정을 내릴 수 있다는 것 자체가, 성능 경쟁만 쫓는 일부 기업과의 차이입니다. 물론 이것이 훈련 비용 회수를 위해 결국 출시해야 하는 현실 앞에서 얼마나 지속될 수 있는지는 별개의 문제입니다.
일반 사용자 입장에서 지금 당장 바뀌는 건 없습니다. Claude Opus 4.6와 Sonnet 4.6는 오늘도 공개 상태이고, 실제 코딩·추론 작업에서 충분히 강력합니다. Mythos 관련 공식 발표가 나오면 anthropic.com/news에서 가장 먼저 확인할 수 있습니다.
본 포스팅 참고 자료
- Fortune, “Exclusive: Anthropic acknowledges testing new AI model representing ‘step change’ in capabilities” — fortune.com (2026.03.26)
- Anthropic 공식 뉴스, “Disrupting the first reported AI-orchestrated cyber espionage campaign” — anthropic.com (2025.11.13)
- Anthropic 공식 뉴스, “Introducing Claude Opus 4.6” — anthropic.com (2026.02.05)
- Anthropic Responsible Scaling Policy Roadmap — anthropic.com (2026.02.22 갱신)
- SecurityBoulevard / Suzu Labs, “Claude Mythos and the Cybersecurity Risk That Was Already Here” — securityboulevard.com (2026.03.30)
- Mashable, “Meet Claude Mythos: Leaked Anthropic post reveals the new most powerful AI model” — mashable.com (2026.03.27)
본 포스팅은 2026년 3월 31일 기준의 공개된 정보를 토대로 작성되었습니다. Claude Mythos(Capybara)는 미공식 유출 자료와 Anthropic의 부분 확인을 바탕으로 한 내용이 포함되어 있으며, 공식 발표 이전까지 세부 사항은 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.











댓글 남기기