Claude Mythos 유출 — 공식 문서로 확인한 진짜 의미

Published on

in

Claude Mythos 유출 — 공식 문서로 확인한 진짜 의미

2026.03.27 기준
Fortune 최초 보도
공식 유출 확인

Claude Mythos 유출 —
공식 문서로 확인한 진짜 의미

Anthropic이 CMS 실수 한 번으로 스스로 꺼낸 카드.
유출 문서에는 “전례 없는 사이버보안 위협”이 적혀 있었습니다.

~3,000개
유출된 내부 자산 수
4.5~9%
보안주 단일 세션 하락
30일
RSP v3.0 발표 후 유출까지

유출은 어떻게 일어났나 — CMS 기본값의 함정

2026년 3월 26일, Fortune이 보도하면서 세상에 알려졌습니다. Anthropic이 사용하는 외부 콘텐츠 관리 시스템(CMS)은 파일을 업로드하면 기본값으로 공개 URL이 붙습니다. 담당자가 ‘비공개’ 설정을 별도로 켜지 않으면 누구나 검색으로 접근할 수 있는 상태가 됩니다. (출처: Fortune, 2026.03.26)

LayerX Security의 시니어 AI 보안 연구원 Roy Paz와 케임브리지대학 사이버보안 연구원 Alexandre Pauwels가 이 캐시를 발견했고, Fortune이 Anthropic에 확인을 요청한 뒤 회사는 데이터베이스에 대한 외부 접근을 차단했습니다. 두 연구원이 검토한 결과, 약 3,000개의 내부 자산이 노출돼 있었습니다. 블로그 이미지, 배너, 로고처럼 사소한 것도 있었지만, 미공개 모델 발표 초안도 그 안에 섞여 있었습니다.

Anthropic은 성명을 통해 “CMS 도구 설정 관련 인적 오류”라고 인정했습니다. 이 초안에는 두 가지 버전이 있었는데, 하나는 모델명이 ‘Mythos’, 다른 하나는 ‘Capybara’였습니다. 두 문서의 부제목에는 공통적으로 “We have finished training a new AI model: Claude Mythos”라는 문장이 남아 있었습니다. (출처: The Decoder, 2026.03.27)

💡 공식 발표문과 실제 유출 경위를 같이 놓고 보니 이런 차이가 보였습니다. “Capybara”라는 이름은 아직 모델명이 확정되지 않았다는 신호입니다. Anthropic은 이름 두 개를 동시에 검토하는 단계였고, 어느 쪽이 최종 출시명이 될지는 아직 공개되지 않았습니다.

▲ 목차로 돌아가기

Mythos가 Opus 4.6과 다른 이유

Anthropic의 현재 모델 체계는 Haiku → Sonnet → Opus 순으로 크기와 성능이 올라갑니다. 그런데 유출된 초안에는 이 위에 새로운 티어가 생긴다는 내용이 담겨 있었습니다. 초안은 이렇게 씁니다: “Capybara is a new name for a new tier of model: larger and more intelligent than our Opus models — which were, until now, our most powerful.” (출처: Fortune, 2026.03.26)

Opus가 최상위가 아닌 시대가 온다는 뜻입니다. 실제 수치도 초안에 포함됐습니다. “Compared to our previous best model, Claude Opus 4.6, Capybara gets dramatically higher scores on tests of software coding, academic reasoning, and cybersecurity, among others.” 구체적인 수치는 초안에 없었지만, Anthropic 대변인은 Fortune에 “step change”이자 “the most capable we’ve built to date”라고 직접 확인했습니다. 모델 훈련이 이미 완료됐다는 점도 함께 밝혔습니다.

모델 티어 위치 비고
Capybara (Mythos) Opus 상위 신규 티어 훈련 완료, 출시 미정
Claude Opus 4.6 기존 최상위 2026.02 출시
Claude Sonnet 4.6 중간 티어 현재 기본 모델
Claude Haiku 경량 티어 속도·비용 최적화

초안은 또 하나의 중요한 사실을 담고 있었습니다. 모델이 “매우 비싸다”는 것입니다. “The model is expensive to run and not yet ready for general release”라고 돼 있었고, Anthropic은 일반 출시 전 효율성을 높이는 작업이 필요하다고 밝혔습니다. 그러니까 지금 당장은 선택된 얼리 액세스 고객사만 API를 통해 테스트하는 단계입니다.

▲ 목차로 돌아가기

“전례 없는 사이버보안 위협”이 뜻하는 것

유출된 초안에서 가장 눈에 띄는 표현은 “unprecedented cybersecurity risks”입니다. 좋게 성능을 홍보하는 글에서 스스로 위험을 전면에 내세우는 건 흔한 일이 아닙니다. 초안은 구체적으로 이렇게 씁니다: “The model is currently far ahead of any other AI model in cyber capabilities, and it presages an upcoming wave of models that can exploit vulnerabilities in ways that far outpace the efforts of defenders.”(출처: Fortune, 2026.03.26)

풀어쓰면, 방어자가 막는 속도보다 공격자가 취약점을 찾는 속도가 더 빨라진다는 얘기입니다. 그래서 Anthropic은 얼리 액세스 단계를 사이버 방어 조직 중심으로 구성했습니다. “We’re releasing it in early access to organizations, giving them a head start in improving the robustness of their codebases against the impending wave of AI-driven exploits.” 공격 도구를 먼저 방어자에게 쥐여주겠다는 전략이지만, 방어자가 아닌 쪽에 이 도구가 쥐어지면 어떻게 되는지는 초안이 직접 경고하고 있습니다.

⚠️ 실제 선례가 있습니다

Anthropic은 2025년 11월 공식 블로그에서 중국 국가 후원 해킹 그룹이 이미 Claude Code를 이용해 약 30개 글로벌 조직(테크 기업, 금융사, 정부기관 포함)에 침투 시도를 한 사실을 공개했습니다. Anthropic이 탐지 후 10일간 조사하고 계정을 차단했지만, 일부 사례는 성공했다고 밝혔습니다. (출처: Anthropic 공식 블로그, 2025.11)

이 선례를 보면 Mythos 수준의 사이버 능력이 일반 출시됐을 때의 리스크가 왜 초안에서 강조됐는지 맥락이 잡힙니다. Claude Code로도 이미 국가 단위 공격 시도가 있었는데, Opus 4.6을 “극적으로” 뛰어넘는 모델이 무분별하게 풀리면 상황이 달라집니다.

▲ 목차로 돌아가기

RSP v3.0 발표 30일 후 유출 — 타이밍이 말해주는 것

Anthropic은 2026년 2월 24일 Responsible Scaling Policy(RSP) 3.0을 발표했습니다. (출처: Anthropic, 2026.02.24) 이 개정의 가장 큰 변화는 두 가지입니다. 첫째, 위험 수준을 충족하지 못하면 개발을 일시 정지하겠다는 ‘포즈 공약(pause commitment)’이 삭제됐습니다. 둘째, ASL-4 수준에 해당하는 기준이 ‘업계 전체 권고사항’으로 격하됐고, 구체적인 정의는 여전히 확정되지 않은 상태입니다. (출처: GovAI RSP v3.0 분석, 2026.03.05)

💡 유출 내용과 RSP v3.0 변화를 함께 놓고 보면 이런 그림이 나옵니다. Mythos는 유출 문서가 “전례 없는 사이버보안 위협”이라고 표현한 모델입니다. ASL-4 수준에 해당할 가능성이 높지만, RSP v3.0은 ASL-4를 구체적으로 정의하지 않았습니다. 즉, 이론상 Mythos가 ASL-4에 해당하더라도 현재 체계에서는 적용할 명확한 관리 기준이 없는 상태입니다.

GovAI(Centre for the Governance of AI) 분석에 따르면 RSP v3.0에서 “ASL-4 Deployment and Security Standards”에 대한 참조가 사라졌고, 이 기준은 이전에도 명확히 정의된 적이 없었습니다. Anthropic은 이를 “미래 능력 수준에 대한 지나치게 경직된 기준 설정을 피하기 위한 것”이라고 설명했습니다. 포즈 공약을 삭제한 이유도 비슷합니다. 경쟁사들이 동참하지 않는 상황에서 혼자 멈추면 오히려 ‘덜 안전한 주체’가 선두에 서게 된다는 논리입니다.

이 논리 자체는 일리가 있습니다. 그러나 RSP v3.0 발표 정확히 30일 후, 스스로 “ASL-4 수준일 수 있는” 모델의 존재가 공개됐다는 점은 그 타이밍 자체가 아이러니합니다. 안전 기준의 완화와 역대 최강 모델의 (의도치 않은) 공개가 같은 달 안에 일어났습니다.

▲ 목차로 돌아가기

보안주가 9% 빠진 이유, 수치로 확인했습니다

유출 다음 날인 3월 27일, 사이버보안 관련 주식이 일제히 하락했습니다. CrowdStrike, Palo Alto Networks, Zscaler, SentinelOne, Okta, Tenable 등이 단일 세션에서 4.5%~9% 빠졌습니다. (출처: CNBC, 2026.03.27; AI.GoPubby 분석, 2026.03.29)

이게 왜 문제냐면, 이 회사들의 제품이 ‘사람이 찾기 어려운 취약점을 발견해 준다’는 가치를 파는 비즈니스이기 때문입니다. Mythos처럼 “방어자의 속도를 넘어서는” AI가 나오면, 역설적으로 방어 솔루션의 가치가 하락하는 게 아니라 — 공격 도구가 훨씬 빨라지는 쪽으로 균형이 깨집니다. 기존 방어 솔루션이 대응할 수 없는 수준의 공격이 늘어날 수 있다는 우려가 주가에 반영된 것입니다.

💡 보안주 폭락은 단순 심리 반응이 아닙니다. 같은 시기 OpenAI도 GPT-5.3-Codex를 “사이버 작업에서 고능력 최초 분류”로 발표했습니다. (출처: Fortune, 2026.02.05) 한 회사의 모델이 아니라 업계 전반이 같은 방향으로 이동하고 있다는 신호를 시장이 읽은 것입니다.

비교 수치를 직접 확인할 수 있는 지점이 하나 더 있습니다. Claude Opus 4.6은 2026년 2월 출시 당시, Anthropic이 “프로덕션 코드베이스에서 미발견 취약점을 찾는 능력”이 있다고 공식 인정하며 “양날의 검”이라고 표현했습니다. Mythos는 그 Opus 4.6을 “극적으로(dramatically)” 넘어서는 모델입니다. 정성적 표현이지만, ‘극적’이라는 단어를 공식 문서에서 쓰는 것은 드문 일입니다.

▲ 목차로 돌아가기

Mythos, 지금 쓸 수 있나요

결론부터 말씀드리면, 2026년 3월 31일 기준으로 일반 사용은 불가능합니다. 유출 초안과 Anthropic 공식 발표 모두 “소수 얼리 액세스 고객과 테스트 중”이라고 밝히고 있습니다. 사이버 방어 조직을 우선 대상으로 하며, Claude API를 통한 접근도 초기에는 제한적으로 확대될 예정입니다.

초안은 모델이 아직 “매우 비싸다”는 점도 명시했습니다. 일반 출시 전 효율화 작업이 필요하다는 의미입니다. 정식 출시 시기는 아직 공개되지 않았고, Anthropic이 Q4 2026 IPO를 목표로 한다는 보도도 있어 출시 일정이 이와 연동될 가능성을 배제하기 어렵습니다. (출처: The Tech Portal, 2026.03.27 — 추정, Anthropic 공식 확인 없음)

개발자 입장에서 지금 할 수 있는 것은, Anthropic의 Safety Bug Bounty 프로그램을 주시하는 것입니다. 유출 시점과 같은 날(2026.03.26) 발표된 이 프로그램은 Mythos 수준의 모델이 가져올 사이버 리스크에 대한 Anthropic의 준비 작업이기도 합니다. Mythos 얼리 액세스 대상에 포함되려면 이쪽 커뮤니티가 가장 빠른 경로일 수 있습니다.

▲ 목차로 돌아가기

자주 묻는 질문

Q
Claude Mythos와 Capybara는 다른 모델인가요?
같은 모델입니다. 유출 초안 두 버전 모두 동일한 내용이지만 이름만 다릅니다. The Decoder 보도에 따르면 Capybara 버전의 부제목에도 “Claude Mythos”가 그대로 남아 있었습니다. Anthropic이 출시명을 두 후보 중 어느 것으로 확정할지는 아직 공개되지 않았습니다.
Q
ASL-4가 뭔데 중요한가요?
Anthropic이 자체적으로 정의한 AI 위험 단계입니다. ASL-3는 현재 Claude Opus 4.6에 적용 중인 수준으로, 화학·생물 무기 관련 경계를 포함합니다. ASL-4는 그보다 훨씬 강한 보안 요건이 필요한 수준인데, RSP v3.0 이후 구체적인 정의가 삭제됐습니다. Mythos가 ASL-4에 해당할 수 있다는 분석이 있지만, 현재 체계에서 ASL-4 기준 자체가 명확하지 않습니다.
Q
기존 Claude Pro 구독자도 Mythos를 쓸 수 있게 되나요?
지금 시점에서는 알 수 없습니다. 초안은 “매우 비싼” 모델이라고 명시했고, 일반 출시 전 효율화가 필요하다고 했습니다. Opus 4.6도 Pro 플랜에서 쓸 수 있는 것처럼 향후 포함될 가능성은 있지만, Anthropic이 공식 일정을 밝히지 않은 부분입니다.
Q
“전례 없는 사이버보안 위협”이라는 표현은 과장이 아닌가요?
Anthropic 스스로 초안에 쓴 표현입니다. 마케팅 용도가 아닌 내부 문서에서 이런 경고 문구를 쓴다는 점이 핵심입니다. 또한 같은 시기 OpenAI도 GPT-5.3-Codex를 “사이버 작업 고능력 최초” 모델로 분류했고(출처: Fortune, 2026.02.05), 사이버보안 주식 4.5~9% 하락은 시장의 판단이 같은 방향이었음을 보여줍니다.
Q
RSP v3.0의 포즈 공약 삭제가 왜 문제인가요?
이전 RSP는 안전 기준을 충족하지 못하면 개발을 멈추겠다는 공약이 있었습니다. 이걸 삭제한 이유는 경쟁사가 멈추지 않는 상황에서 혼자 멈추면 ‘더 위험한 주체’가 앞서기 때문이라고 Anthropic은 설명합니다. GovAI는 이 논리는 이해할 수 있지만, 그렇다면 Anthropic이 규제 강화를 더 적극적으로 요구해야 한다고 지적했습니다.(출처: GovAI, 2026.03.05)

▲ 목차로 돌아가기

마치며 — 가장 안전을 강조하던 회사가 보낸 신호

Anthropic은 AI 안전을 회사의 정체성으로 내세워 왔습니다. RSP를 가장 먼저 만든 회사이기도 합니다. 그런데 이번 달 안에 두 가지 일이 동시에 일어났습니다. 하나는 포즈 공약을 뺀 RSP v3.0 발표, 다른 하나는 “전례 없는 사이버 위협”을 가진 모델의 의도치 않은 공개입니다.

이걸 보고 Anthropic을 비난하는 건 너무 단순한 접근입니다. 경쟁사가 멈추지 않는 상황에서 혼자 멈추는 것이 현실적으로 어렵다는 점, 그리고 오히려 방어 조직에게 먼저 접근권을 주겠다는 전략은 그나마 합리적인 대응입니다. 다만 그 전략이 제대로 작동하려면 ASL-4 기준이 명확히 정의돼야 하고, 얼리 액세스 대상 선정이 투명해야 합니다. 두 가지 모두 아직 Anthropic이 공개한 내용이 없습니다.

Mythos가 언제 일반 출시될지, 최종 이름이 뭐가 될지는 아직 모릅니다. 그러나 훈련이 완료됐다는 건 확인됐습니다. 앞으로 몇 달 안에 어떤 형태로든 움직임이 있을 것이고, 그때 이 유출 문서의 경고 문구들이 실제로 어느 정도였는지 판단할 수 있게 됩니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Fortune — Anthropic confirms Claude Mythos existence: fortune.com (2026.03.26)
  2. The Decoder — Anthropic leak reveals new model Claude Mythos: the-decoder.com (2026.03.27)
  3. GovAI — Anthropic’s RSP v3.0 분석: governance.ai (2026.03.05)
  4. CoinDesk — Anthropic most powerful AI model leaked: coindesk.com (2026.03.28)
  5. Futurism — Anthropic step-change new model: futurism.com (2026.03.26)
  6. Anthropic 공식 RSP v3.0 PDF: anthropic.com (2026.02.24)

본 포스팅은 2026년 3월 31일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Anthropic의 모델 출시 일정, 요금, 기능은 공식 발표에 따라 달라집니다. 본 포스팅에 인용된 초안 문서는 Anthropic이 “early drafts of content considered for publication”으로 공식 인정했으며, 최종 출시 내용과 다를 수 있습니다.

댓글 남기기


최신 글

  • 주택청약 당첨 포기 2026, 재당첨 제한 체크
    주택청약 당첨 포기 2026 기준으로 주택 유형과 지역, 일정과 통장 영향, 사유와 소명 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 전입세대확인서 열람 2026, 계약 전 주소 확인
    전입세대확인서 열람 2026 기준으로 주소와 동·호수, 기존 전입 여부, 등기부·확정일자 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 명의도용 신고 2026, 개통 내역 확인
    휴대폰 명의도용 신고 2026 기준으로 모르는 회선, 최근 인증·개통 문자, 통신사와 번호 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 분실신고 재발급 2026, 자동이체 누락 체크
    카드 분실신고 재발급 2026 기준으로 카드 정지, 분실 전후 사용처, 새 카드 수령 전 결제 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴면보험금 조회 청구 2026, 내보험찾아줌 전 확인
    휴면보험금 조회 청구 2026 기준으로 보험금 종류, 계약자와 피보험자, 현재 담당 보험사 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 자동차 압류조회 해제 2026, 이전등록 전 체크
    자동차 압류조회 해제 2026 기준으로 압류·저당 표시, 기관과 금액, 반영 시점 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기