Claude Mythos, 안전 1위 회사가 보안 사고로 공개됐습니다

Published on

in

Claude Mythos, 안전 1위 회사가 보안 사고로 공개됐습니다

2026.03.26 기준 / Claude Mythos (Capybara tier, pre-release)

Claude Mythos, 안전 1위 회사가 보안 사고로 공개됐습니다

“전례 없는 사이버보안 위협”을 가진 모델이라고 직접 쓴 Anthropic의 초안 블로그 포스트가 — 보안 허점으로 유출됐습니다. 결론부터 말씀드리면, Claude Mythos는 기존 Opus 4.6 위에 완전히 새로운 티어로 출시 예정이고, Anthropic 스스로 “지금까지 만든 것 중 가장 강력하다”고 공식 확인했습니다.

🔥 Capybara 새 티어
💻 SWE-bench 약 87%
🔒 사이버보안 리스크
📅 IPO 타이밍 연동

Mythos가 세상에 나온 방식이 이미 아이러니합니다

2026년 3월 26일, Fortune이 Anthropic의 미공개 블로그 포스트 초안을 단독 입수했습니다. 이 초안은 Anthropic의 콘텐츠 관리 시스템(CMS) 설정 오류로 누구나 접근 가능한 공개 데이터 캐시에 저장돼 있었고, LayerX Security 수석 연구원 Roy Paz와 케임브리지대 연구원 Alexandre Pauwels가 이를 검토했습니다. 유출된 자산은 약 3,000개에 달했습니다. (출처: Fortune, 2026.03.26)

이걸 직접 보면서 든 생각은 딱 하나였습니다. “AI 안전을 가장 강조하는 회사가, 자기 서버 보안은 이렇게 허술했다.” 그 유출된 초안에는 새 모델이 “전례 없는(unprecedented) 사이버보안 위험을 초래한다”는 내용이 담겨 있었거든요. 아이러니가 아니라, 실제로 일어난 일입니다.

💡 공식 발표문과 실제 유출 경위를 같이 놓고 보니 이런 차이가 보였습니다 — Anthropic이 RSP(책임있는 확장 정책) 3.0을 통해 클라우드 보안 강화를 약속한 지 30일도 안 된 시점에, CMS 기본 설정 실수로 3,000건의 미공개 자료가 열린 것입니다. RSP 3.0은 2026년 2월 24일 발효됐고, 유출은 3월 26일에 발생했습니다. (출처: Anthropic RSP 버전 이력, anthropic.com/responsible-scaling-policy)

Anthropic은 Fortune의 문의를 받은 직후 데이터 저장소 공개 접근을 차단하고, “CMS 외부 도구 설정 오류로 인한 인적 실수”라고 공식 인정했습니다. 실수는 실수이지만, 타이밍이 만들어 낸 상징성은 무시하기 어렵습니다.

▲ 목차로 돌아가기

Capybara는 Opus 위의 완전히 새로운 티어입니다

현재 Anthropic의 모델 구조는 Haiku → Sonnet → Opus 세 단계입니다. Opus 4.6이 지금의 최상위 모델입니다. 그런데 유출된 초안에는 이렇게 적혀 있었습니다.

“Capybara is a new name for a new tier of model: larger and more intelligent than our Opus models—which were, until now, our most powerful.”

출처: Anthropic 유출 초안 블로그 포스트 (Fortune 단독 입수, 2026.03.26)

Capybara와 Mythos는 같은 모델을 가리키는 두 이름입니다. The Decoder 분석에 따르면 초안이 두 버전으로 존재했는데, 하나는 모델 이름을 “Mythos”로 표기하고 다른 하나는 “Capybara”로 교체했습니다. 그런데 두 번째 버전의 부제목에는 여전히 “We have finished training a new AI model: Claude Mythos”라고 남아 있었습니다. 이름을 최종 확정하기 전에 유출된 것입니다. (출처: The Decoder, 2026.03.27)

티어 규모 가격 현재 상태
Capybara / Mythos Opus 초과 매우 고가 (미정) 얼리 액세스 테스트 중
Opus 4.6 최대 (현 최강) 고가 ✅ 일반 출시
Sonnet 4.6 중간 중간 ✅ 일반 출시
Haiku 소형 저가 ✅ 일반 출시

※ Capybara/Mythos 가격 및 컨텍스트 창 크기는 공식 발표 전까지 미공개 상태입니다.

▲ 목차로 돌아가기

벤치마크 숫자가 뭘 바꾸는지 직접 따져봤습니다

유출 초안에는 코딩, 학술 추론, 사이버보안 세 영역에서 Opus 4.6 대비 “dramatically higher scores”라는 표현이 사용됐습니다. MindStudio 분석 보고서(2026.03.28)는 이를 구체적으로 해석했습니다.

SWE-bench Verified — 가장 큰 격차가 나는 영역

SWE-bench Verified는 GitHub 실제 이슈를 프로덕션 코드베이스에서 해결하는 능력을 측정합니다. HumanEval처럼 정리된 예제가 아니라 실제 지저분한 코드 환경이 기준입니다. Opus 4.6의 SWE-bench Verified 점수는 72~73% 수준입니다. 유출 문서가 시사하는 Mythos 수치는 mid-to-high 80%대, 즉 약 85~87% 구간입니다. (출처: MindStudio 분석, mindstudio.ai, 2026.03.28) 73%에서 87%로의 14%p 상승은 수치만 보면 작아 보이지만, 실제로는 “해결 못 하던 진짜 어려운 버그”를 추가로 14%p 더 잡아낸다는 의미입니다.

💡 공식 문서와 벤치마크 흐름을 교차해 보면 이런 패턴이 나타납니다 — 업계에서 SWE-bench 점수가 80%를 넘기기 시작한 건 2025년 말부터였고, 그 전까지 70%대가 사실상 “최고” 구간이었습니다. Mythos가 이 선을 확실히 돌파한다면, 자율 코딩 에이전트의 실사용 수준이 한 단계 올라가는 겁니다.

GPQA Diamond — 격차가 압축된 영역

GPQA Diamond는 대학원 수준의 생물학·화학·물리학 문제로 구성됩니다. 인터넷을 검색해도 비전문가는 틀리도록 설계된 시험입니다. Opus 4.6은 76% 안팎으로 추정되며, Mythos는 저-중간 80%대로 올라설 것으로 유출 자료는 시사합니다. 절대치로는 약 6~8%p 상승이지만, 그 구간의 문제들은 다단계 추론과 교차 도메인 지식이 필요한 “기존 모델이 자주 틀리는 유형”이라는 점이 핵심입니다.

⚠️ 유출 전 단계의 수치이므로, 실제 출시 시점 공식 벤치마크와 다를 수 있습니다. 방향성으로 해석할 것을 권장합니다.

▲ 목차로 돌아가기

사이버보안 위험을 Anthropic이 먼저 꺼낸 이유가 있습니다

기업이 신제품을 출시할 때 “이 제품은 위험합니다”라고 먼저 말하는 경우는 드뭅니다. 그런데 유출된 초안에는 이 문장이 그대로 들어 있었습니다.

“In preparing to release Claude Capybara, we want to act with extra caution and understand the risks it poses — even beyond what we learn in our own testing. In particular, we want to understand the model’s potential near-term risks in the realm of cybersecurity — and share the results to help cyber defenders prepare.”

출처: Anthropic 유출 초안 (Fortune, 2026.03.26 보도)

Anthropic은 Mythos가 “현재 사이버 능력 면에서 다른 어떤 AI 모델보다 훨씬 앞서 있다(currently far ahead of any other AI model in cyber capabilities)”고 직접 표현했고, 이 모델이 “방어자의 대응 속도를 압도하는 AI 기반 취약점 공격의 파도”를 예고한다고 썼습니다. (출처: Fortune, 2026.03.26) 사이버보안 주가가 유출 다음 날 급락한 건 이 문장 때문입니다.

💡 실제로 이미 일어난 일과 연결해서 보면 맥락이 더 선명해집니다 — Anthropic은 2025년 11월 공식 블로그를 통해 중국 국가 지원 해킹 그룹이 Claude Code를 활용해 약 30개 글로벌 기관을 공격했음을 공개한 바 있습니다. 당시 모델은 Opus 4.6이었습니다. Mythos가 사이버 능력을 한 단계 더 올린다면 이 위험은 증폭됩니다. (출처: Anthropic 공식 블로그 “Disrupting AI Espionage”, 2025.11)

Anthropic의 전략은 모델 능력을 숨기는 게 아니라, 능력을 먼저 공개하고 방어자에게 선행 액세스를 주는 것입니다. 얼리 액세스 대상이 “보안 전문 기업”임을 초안이 명시하는 이유가 여기 있습니다. 이것이 RSP 3.0의 “책임 있는 공개” 원칙과 연결되는 지점입니다. (출처: Anthropic RSP v3.0, 2026.02.24 발효)

▲ 목차로 돌아가기

지금 바로 못 쓰는 이유 — 비용과 출시 전략

유출 초안에서 Anthropic이 직접 쓴 문장 중 실용적으로 중요한 건 이겁니다. “very expensive for us to serve, and will be very expensive for our customers to use.” 일반 출시 전에 효율을 대폭 끌어올려야 한다고도 밝혔습니다. (출처: The Decoder, 2026.03.27)

막상 써보고 싶다고 해도 지금은 불가능합니다. 현재는 소수 얼리 액세스 고객사를 대상으로 API 테스트만 진행 중이며, 그 대상은 사이버보안 평가를 담당하는 기업으로 한정됩니다. Anthropic이 “출시 전 사이버 방어 역량을 먼저 키운다”는 명분을 앞세운 만큼, 일반 출시까지는 최소 수 개월이 필요할 것으로 보입니다.

현재 (2026.04 기준)

소수 얼리 액세스 고객사 (사이버보안 중심) 테스트 진행 중

다음 단계

서빙 비용 최적화 후 점진적 API 확장, 일반 출시 시점 미정

기대했던 것과 달랐습니다 — 단순히 “새 모델이 나왔으니 쓸 수 있다”는 게 아니라, Anthropic이 이 모델을 일부러 천천히 내보내는 전략을 채택한 것입니다. 이 선택은 비용만의 문제가 아니라 안전 평가와 IPO 타이밍이 복합적으로 얽혀 있습니다.

▲ 목차로 돌아가기

IPO 일정과 Mythos 출시가 맞물린 배경

Bloomberg(2026.03.27)는 Anthropic이 2026년 10월 IPO를 검토 중이며, Goldman Sachs·JPMorgan·Morgan Stanley가 주관사로 논의되고 있다고 단독 보도했습니다. The Information도 같은 날 “Q4 IPO 논의 중”이라고 확인했습니다. (출처: Bloomberg, 2026.03.27 / The Information, 2026.03.27)

💡 두 개의 공개 타임라인을 함께 올려놓으니 패턴이 보였습니다 — The Decoder(2026.03.27)는 “Anthropic과 OpenAI 모두 각자의 가장 강력한 모델 출시 타이밍을 IPO 포지셔닝에 맞출 가능성이 크다”고 직접 명시했습니다. Mythos를 IPO 직전인 여름~초가을 공개하면 기업가치 산정에서 최대의 무기가 됩니다. (출처: The Decoder, 2026.03.27)

Anthropic은 현재 연간 매출 기준으로 OpenAI를 추월할 수도 있다는 분석이 나오는 상황입니다. 2026년 2월 Reddit 커뮤니티 분석에 따르면, Claude Code와 Claude Cowork가 개발자 시장에서 폭발적 채택을 보이며 OpenAI를 압박했습니다. Mythos의 IPO 전 출시는 이 흐름을 확정짓는 마지막 카드가 될 수 있습니다.

단, ai.gopubby.com의 분석처럼 “유출이 우연이었는지 전략적이었는지”는 아직 공식 답변이 없습니다. Anthropic의 공식 설명은 “CMS 인적 오류”에서 더 나아가지 않았습니다.

▲ 목차로 돌아가기

Q&A

Claude Mythos는 언제 일반 출시되나요?

Anthropic은 출시 일정을 공식 발표하지 않았습니다. 초안 문서는 “서빙 비용 효율화 이전에는 일반 출시하지 않는다”고 명시했으며, 현재 얼리 액세스 단계입니다. IPO 일정(2026년 10월 검토)을 감안하면 여름~초가을이 유력하다는 관측이 있지만, 공식 근거는 없습니다.

Capybara와 Mythos는 같은 모델인가요?

같은 모델입니다. 유출된 초안이 두 버전(이름만 다름)으로 존재했고, Anthropic은 이름을 최종 확정하기 전에 유출됐습니다. 부제목에 “Claude Mythos”가 남아 있는 버전이 초기 작업본이고, 본문에서 “Capybara”로 교체된 버전이 후기 작업본으로 추정됩니다. (출처: The Decoder, 2026.03.27)

Claude Pro 구독자도 Mythos를 쓸 수 있게 되나요?

현 단계에서는 알 수 없습니다. Anthropic이 공식 답변을 내놓지 않은 부분입니다. 다만 Capybara가 “Opus보다 크고 비싸다”고 명시된 만큼, 출시 초기에는 API 고과금 플랜 또는 별도 요금제로 제공될 가능성이 높습니다.

유출된 벤치마크 수치를 신뢰해도 되나요?

방향성 참고는 가능하지만, 확정 수치로 다루면 안 됩니다. 유출 전 단계의 수치는 정식 출시 시점에 달라지는 경우가 잦습니다. Anthropic 스스로 “훈련을 마쳤다”고 확인했으므로 최종 평가는 완료됐겠지만, 공개 벤치마크 결과는 출시 시 공식 발표로 확인해야 합니다.

Mythos는 OpenAI의 새 모델 “Spud”과 경쟁하나요?

The Decoder(2026.03.27)는 OpenAI도 “Spud”라는 코드명의 모델을 사전 학습 완료 상태로 준비 중이며, 두 회사 모두 IPO 포지셔닝을 위해 출시 타이밍을 조율할 가능성이 있다고 분석했습니다. 공식 발표가 없으므로 구체적 비교는 아직 불가능합니다.

▲ 목차로 돌아가기

마치며

Claude Mythos를 정리하면서 가장 인상적인 건 벤치마크 숫자가 아니었습니다. “AI 안전을 가장 강조하는 회사가, 안전 관련 모델의 위험성을 경고하는 문서를, 보안 허점으로 유출했다”는 구조 자체였습니다. RSP 3.0이 발효된 지 30일이 안 된 시점에 발생한 일이기도 합니다.

코딩 에이전트를 쓰는 입장에서는 SWE-bench 73%에서 87%로의 도약이 실제로 의미 있는 변화입니다. 디버깅 루프 횟수가 줄고, 복잡한 코드베이스에서 에이전트가 혼자 처리할 수 있는 범위가 넓어집니다. 그 숫자 변화가 실제 업무에 어떻게 반영되는지는 출시 후 직접 검증이 필요합니다.

일반 출시까지는 아직 기다려야 합니다. 다만 이번 유출로 Anthropic이 Mythos를 어떻게 포지셔닝할지는 사실상 공개됐습니다. 그 전략 자체를 이해하고 있는 것도 나쁘지 않습니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. Fortune 단독 보도 — Anthropic Mythos 유출 및 공식 확인 (fortune.com, 2026.03.26)
  2. The Decoder — 유출 초안 상세 분석 (the-decoder.com, 2026.03.27)
  3. Anthropic 공식 RSP v3.0 페이지 (anthropic.com/responsible-scaling-policy)
  4. MindStudio — Claude Mythos vs Opus 4.6 벤치마크 분석 (mindstudio.ai, 2026.03.28)
  5. Bloomberg — Anthropic IPO 검토 보도 (bloomberg.com, 2026.03.27)
  6. Futurism — Mythos 유출 종합 분석 (futurism.com, 2026.03.27)

※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문의 벤치마크 수치는 유출된 사전 공개 자료 기준이며, 공식 출시 시 수치와 다를 수 있습니다. Claude Mythos / Capybara는 2026년 4월 1일 기준 출시 전 모델입니다. 가격·컨텍스트 창·세부 기능은 Anthropic 공식 발표 자료로 확인하시기 바랍니다.

댓글 남기기


최신 글

  • 국민연금 반환일시금 청구 2026, 수급 조건 확인
    국민연금 반환일시금 청구 2026 기준으로 10년 기준, 연령·국외이주 등, 신분·계좌·증빙 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 건강보험 환급금 조회 2026, 본인부담금 확인
    건강보험 환급금 조회 2026 기준으로 공식 화면 여부, 발생 사유, 본인 명의 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 주택청약 당첨 포기 2026, 재당첨 제한 체크
    주택청약 당첨 포기 2026 기준으로 주택 유형과 지역, 일정과 통장 영향, 사유와 소명 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 전입세대확인서 열람 2026, 계약 전 주소 확인
    전입세대확인서 열람 2026 기준으로 주소와 동·호수, 기존 전입 여부, 등기부·확정일자 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 명의도용 신고 2026, 개통 내역 확인
    휴대폰 명의도용 신고 2026 기준으로 모르는 회선, 최근 인증·개통 문자, 통신사와 번호 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 분실신고 재발급 2026, 자동이체 누락 체크
    카드 분실신고 재발급 2026 기준으로 카드 정지, 분실 전후 사용처, 새 카드 수령 전 결제 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기