2026.03.18 공식 출시 기준
MiMo-V2-Pro / MoE 1T params

샤오미 MiMo-V2-Pro, 폰 회사 AI가 맞긴 한가요?

3월 11일, OpenRouter에 정체불명의 AI 모델 하나가 조용히 올라왔습니다. 아무 설명도 없이 이름만 “Hunter Alpha”. 일주일 만에 일일 사용량 1위, 누적 1조 토큰 돌파. AI 커뮤니티는 “드디어 DeepSeek V4″라고 난리가 났습니다. 정체는 샤오미였습니다.

8위

글로벌 AI 인텔리전스 지수

1/7

Claude Opus 4.6 대비 API 비용

1조

Hunter Alpha 기간 총 사용 토큰

Hunter Alpha의 정체 — 가장 중요한 사실부터

샤오미 MiMo-V2-Pro는 2026년 3월 18일, 공식 명칭을 달고 세상에 나왔습니다. 그런데 이 모델은 사실 일주일 전부터 이미 세상에 돌아다니고 있었습니다. “Hunter Alpha”라는 익명 코드명으로 OpenRouter에 올라간 채, 개발사 이름도 회사 정보도 없이. 그게 뭔지 아무도 몰랐습니다.

일주일 동안 AI 커뮤니티에서는 “DeepSeek V4가 나왔다”는 추측이 지배적이었습니다. 고성능 코딩, 1조 파라미터, 중국산이라는 힌트가 딱 들어맞았거든요. 3월 18일, 샤오미 MiMo 팀장 뤄 푸리(Luo Fuli)가 X(구 트위터)에 짧게 썼습니다. “이걸 조용한 기습이라고 부릅니다.” 그날 샤오미 주가는 5.8% 올랐습니다.

💡 공식 발표문과 OpenRouter 사용 데이터를 같이 놓고 보니 이런 그림이 나왔습니다 — Hunter Alpha는 정식 출시 전 내부 테스트 빌드였고, 1주일 동안 시장 반응을 먼저 재고 나서야 공개된 셈입니다. 샤오미가 의도했든 아니든, 결과적으로 가장 저비용 고효율 출시 전략이 됐습니다.

뤄 푸리는 원래 DeepSeek R1 프로젝트를 이끌었던 연구자입니다. 그가 샤오미로 옮겨 만든 첫 번째 결과물이 2025년 12월 MiMo-V2-Flash(309B MoE)였고, 서방 AI 언론은 거의 주목하지 않았습니다. MiMo-V2-Pro는 그 Flash 대비 총 파라미터가 약 3배 커진 모델로, 활성 파라미터는 42B입니다.(출처: Xiaomi MiMo 공식 페이지, 2026.03.18)

→ 파라미터 전체 1T지만 실제 연산은 42B만 돌아갑니다. 무거워 보여도 실제 지연은 제한적입니다.

▲ 목차로 돌아가기

1조 파라미터인데 비용이 이게 맞나요?

여기서 잠깐 멈춰야 합니다. 보통 모델 크기가 크면 비용도 커집니다. 그게 상식입니다. MiMo-V2-Pro의 가격표는 그 상식을 정면으로 흔듭니다.

모델	입력 (1M 토큰)	출력 (1M 토큰)	인덱스 실행 총비용
MiMo-V2-Pro (256K)	$1	$3	$348
GPT-5.2	$1.75	$14	$2,304
Claude Opus 4.6	$5	$25	$2,486
Claude Sonnet 4.6	$3	$15	—
출처: Artificial Analysis Intelligence Index 실행 비용 (artificialanalysis.ai, 2026.03.20), Anthropic 공식 가격 (anthropic.com/pricing)

Artificial Analysis가 동일한 벤치마크 인덱스를 돌리는 데 MiMo-V2-Pro는 $348, Claude Opus 4.6은 $2,486이 들었습니다.(출처: artificialanalysis.ai, 2026.03.20) 약 7분의 1입니다. 점수 차이는 1포인트(MiMo 49점 vs Opus 4.6 상위권)입니다. 1포인트 차이에 7배 가격 차이가 난다는 건, 적어도 비용 효율 관점에서 기존 서방 모델의 공식이 완전히 다시 쓰여야 한다는 뜻입니다.

→ 같은 수준 지능에 7분의 1 비용. 프로덕션 파이프라인이라면 이건 무시할 수 없는 숫자입니다.

▲ 목차로 돌아가기

벤치마크 숫자 직접 뜯어봤습니다

MiMo-V2-Pro를 소개하는 글마다 “Opus급 성능”이라는 표현이 나옵니다. 솔직히 말하면 정확하지는 않습니다. 공식 수치를 직접 보면 분야별로 편차가 상당합니다.

PinchBench (에이전트)

81.0

글로벌 3위

Opus 4.6 81.5 / Omni 81.2

ClawEval (에이전트)

61.5

글로벌 3위

Opus 4.6 66.3 / GPT-5.2 50.0

SWE-bench Verified (코딩)

78%

Opus 4.6 80.8%

Sonnet 4.6 79.6%

할루시네이션 비율

30%

Flash 48% 대비 개선

Opus 4.6 계열이 여전히 앞서

출처: Xiaomi MiMo 공식 페이지(mimo.xiaomi.com/mimo-v2-pro), Artificial Analysis(artificialanalysis.ai, 2026.03.20), Yahoo Tech 리뷰(2026.03.29)

에이전트 코딩과 에이전트 프레임워크 작업에서는 Opus 4.6에 1~5점 이내로 따라붙습니다. 반면 수학 추론(FrontierMath 수준)은 확실히 약합니다. Yahoo Tech가 직접 테스트한 결과, 19차 다항식 문제에서 두 번 완전 멈춤(freeze) 후 틀린 답을 냈습니다.(출처: Yahoo Tech MiMo-V2-Pro 리뷰, 2026.03.29)

→ 코딩·에이전트 작업엔 강하지만, 고급 수학 추론에서는 아직 갭이 있습니다.

▲ 목차로 돌아가기

OpenRouter 1위가 말해주는 것

2026년 3월 현재 OpenRouter 일일 사용량 기준 상위 6개 모델이 모두 중국 AI입니다. MiMo-V2-Pro(샤오미), Step 3.5 Flash(stepfun), DeepSeek V3.2, MiniMax M2.7, MiniMax M2.5, GLM 5 Turbo. Anthropic의 Claude Opus 4.6은 7위, Sonnet 4.6은 8위입니다.(출처: The Register, 2026.03.28 / OpenRouter LLM Rankings)

💡 가격표와 순위를 함께 놓고 보면 이렇게 보입니다 — OpenRouter 상위 6개 중국 모델의 공통점은 “서방 최상위 모델 대비 1/7~1/10 가격”입니다. 성능 격차가 최상급 대비 작아지고 가격 차이는 유지되는 지점에서 개발자들이 어디로 이동하는지를 보여주는 데이터입니다.

The Register가 인용한 수치를 보면, Anthropic의 OpenRouter 시장 점유율은 2025년 3월 22일 29.1%에서 2026년 3월 21일 13.3%로 정확히 반 토막 났습니다.(출처: The Register, 2026.03.28) 이 수치 하나가 ‘가격 전쟁’이 어떻게 진행 중인지를 가장 짧게 요약해 줍니다.

→ 1년 만에 시장 점유 절반. 성능 경쟁이 아니라 가격 경쟁으로 판이 바뀐 겁니다.

Kilo Code가 같은 시기 Claude Opus 4.6과 MiniMax M2.7을 직접 비교한 결과, “품질의 90%를 7% 비용에 얻었다($0.27 vs $3.67)”고 공식 블로그에 게재했습니다.(출처: blog.kilo.ai, 2026.03 기준) MiMo-V2-Pro는 이 트렌드에서 가장 최신·최고 성능 포지션을 차지하고 있습니다.

▲ 목차로 돌아가기

샤오미가 아닌 이유가 되는 세 가지

성능과 가격만 보면 혹할 수밖에 없습니다. 그런데 막상 써보려 할 때 걸리는 지점이 있습니다. 솔직하게 적습니다.

⚠️ 한계 ① 텍스트 전용, 멀티모달 없음

현재 MiMo-V2-Pro API는 텍스트 입력·출력만 지원합니다. 이미지, 영상, 오디오는 별도 모델인 MiMo-V2-Omni를 써야 합니다.(출처: artificialanalysis.ai, 2026.03.20) 하나의 파이프라인에서 멀티모달 작업을 처리하려면 두 모델을 분리 운영해야 합니다.

⚠️ 한계 ② 웨이트 미공개 — 보안 감사 불가

Flash 버전(309B)은 MIT 라이선스로 웨이트가 공개돼 있지만, Pro는 현재 샤오미 퍼스트파티 API 전용으로만 제공됩니다.(출처: Artificial Analysis, 2026.03.20) 기업 보안팀이 내부 모델 수준의 감사를 진행할 수 없다는 뜻입니다. 뤄 푸리는 “안정화되면 오픈소스 변형을 공개할 것”이라고 했지만, 일정은 공식적으로 발표된 것이 없습니다.

⚠️ 한계 ③ 에이전트 작업의 토큰 소비 문제

VentureBeat 분석에 따르면, MiMo-V2-Pro는 어려운 추론 작업에서 생각 단계(thinking phase)에 상당량의 토큰을 소비합니다. 1M 컨텍스트 티어를 쓰면 입력 단가가 $2/1M 토큰으로 올라갑니다. 장문 컨텍스트 파이프라인에서는 비용 이점이 예상보다 줄어들 수 있습니다.(출처: Yahoo Tech, 2026.03.29)

▲ 목차로 돌아가기

실제 어떻게 쓸 수 있나요?

지금 당장 쓸 수 있는 경로는 두 가지입니다. 첫 번째는 공식 AI Studio(aistudio.xiaomimimo.com), 두 번째는 공식 API 플랫폼(platform.xiaomimimo.com)입니다. 출시 1주일 동안 OpenClaw, OpenCode, KiloCode, Blackbox, Cline 다섯 개 에이전트 프레임워크와 무료 API 연동을 제공했고, 프로모션 종료 여부는 공식 채널을 직접 확인하는 게 정확합니다.

💡 공식 사이트의 온보딩 흐름을 보면 이 모델이 누구를 주요 타겟으로 삼는지 드러납니다 — AI Studio의 원클릭 OpenClaw 통합은 인프라 세팅 없이 바로 에이전트를 실행할 수 있게 해줍니다. Claude Code나 Cursor 같은 기존 코딩 도구에 익숙한 사용자라면 진입 장벽이 매우 낮습니다.

한국에서 접속하는 경우, 일부 Xiaomi 앱 내 네이티브 통합(샤오미 브라우저, Kingsoft Office 등)은 중국 현지 기능에 한정돼 있습니다. 다만 API와 웹 AI Studio 자체는 전 세계 어디서든 브라우저로 접근 가능합니다.(출처: MSN/Xiaomi 발표, 2026.03) 한국 사용자가 API 키 방식으로 바로 통합하는 데 특별한 제한은 현재 공식적으로 발표된 것이 없습니다.

→ 한국에서 API 직접 접근은 가능. 앱 내 통합 기능은 중국 서비스 우선입니다.

샤오미는 2026년 이후 3년간 AI에 최소 87억 달러(약 12조 원)를 투자한다고 발표했습니다.(출처: Reuters, 2026.03.19) 전기차에서 스마트폰, 스마트폰에서 AI로 이어지는 샤오미의 하드웨어-소프트웨어 수직 통합 전략을 감안하면, MiMo가 일회성 실험이 아닌 장기 플레이라는 게 숫자로 뒷받침됩니다.

▲ 목차로 돌아가기

Q&A

Q1. Hunter Alpha와 MiMo-V2-Pro는 완전히 같은 모델인가요?

같지 않습니다. Hunter Alpha는 MiMo-V2-Pro의 초기 내부 테스트 빌드입니다. 공식 출시 전 일주일 동안 OpenRouter에서 실사용 테스트를 거쳤고, 정식 출시 전에 특히 장문 컨텍스트 안정성과 에이전트 시나리오 성능이 추가 개선됐습니다.(출처: Xiaomi MiMo 공식 페이지)

Q2. 오픈소스로 공개될 예정인가요?

뤄 푸리가 “충분히 안정화되면 오픈 웨이트 변형을 공개하겠다”고 밝혔지만, 구체적 일정은 현재 발표되지 않았습니다. MiMo-V2-Flash(309B)는 이미 MIT 라이선스로 Hugging Face에 공개돼 있습니다.(출처: Xiaomi, X 포스팅, 2026.03.18)

Q3. Claude나 GPT 대신 MiMo-V2-Pro를 쓰면 무조건 저렴한가요?

256K 이하 컨텍스트 기준으로는 입력 $1/출력 $3으로 Claude Sonnet 4.6($3/$15)보다 훨씬 저렴합니다. 단, 1M 컨텍스트 티어($2/$6)를 자주 쓰거나 에이전트 추론 작업에서 토큰 소비가 늘어나면 예상보다 비용이 올라갈 수 있으므로, 실제 워크로드 패턴을 먼저 확인하는 게 좋습니다.(출처: Xiaomi MiMo 공식 가격, 2026.03.18)

Q4. 이미지나 영상 분석도 되나요?

Pro 모델은 텍스트 전용입니다. 이미지·오디오·영상 처리는 동시 발표된 MiMo-V2-Omni를 이용해야 합니다. Omni는 이 기능들이 별도 모듈이 아닌 통합 학습 방식으로 탑재됐다고 공식 소개에서 강조하고 있습니다.(출처: Xiaomi MiMo 공식 발표, 2026.03.18)

Q5. 샤오미 AI라서 데이터 보안 문제가 있지 않나요?

모델 웨이트가 공개되지 않아 퍼스트파티 API를 통해서만 사용해야 하는 현재 구조에서는, 프롬프트와 결과가 샤오미 서버를 거칩니다. 기업 환경에서 민감 데이터를 처리하는 경우, 현재로서는 내부 모델 감사가 불가능하다는 점을 VentureBeat과 Artificial Analysis 모두 지적하고 있습니다. 공식 데이터 처리 정책은 platform.xiaomimimo.com 약관에서 직접 확인해야 합니다.

▲ 목차로 돌아가기

마치며 — 총평

“폰 회사 AI”라는 선입견은 이미 틀렸습니다. 샤오미는 전기차도 만들고, 이제 글로벌 8위 AI도 만듭니다. MiMo-V2-Pro는 에이전트 코딩 영역에서 Claude Opus 4.6에 5점 이내로 따라붙으면서, API 비용은 7분의 1입니다. 개인 개발자나 스타트업이 무거운 프로덕션 파이프라인을 돌려야 할 때, 이 가격표는 무시하기 어렵습니다.

그래도 제가 바로 Claude에서 갈아타지 않는 이유는 두 가지입니다. 첫째, 웨이트 비공개 + 퍼스트파티 API 전용이라는 구조는 기업 데이터 흐름에 대한 통제권을 외부에 넘기는 것입니다. 둘째, 수학 추론과 극한 멀티스텝 추론에서 확인된 한계는 아직 실제 사용에서 변수로 남습니다. 오픈소스 변형이 안정화되는 시점, 그리고 256K 이하 작업 위주의 개발자라면 지금 당장 테스트해볼 이유가 충분히 있습니다.

Hunter Alpha가 OpenRouter에서 1위를 찍었을 때, 아무도 그게 샤오미인 줄 몰랐습니다. 중요한 건 그 1주일 동안 누구도 뒤로 돌아가지 않았다는 겁니다.

본 포스팅 참고 자료

본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 수록된 벤치마크 수치는 2026년 3월 18~30일 공개 자료 기준이며, 이후 모델 업데이트에 따라 달라질 수 있습니다. API 이용 시 공식 플랫폼의 최신 요금 및 이용약관을 직접 확인하시기 바랍니다.

샤오미 MiMo-V2-Pro, 폰 회사 AI가 맞긴 한가요?

Hunter Alpha의 정체 — 가장 중요한 사실부터

1조 파라미터인데 비용이 이게 맞나요?

벤치마크 숫자 직접 뜯어봤습니다

OpenRouter 1위가 말해주는 것

샤오미가 아닌 이유가 되는 세 가지

실제 어떻게 쓸 수 있나요?

Q&A

마치며 — 총평

본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

샤오미 MiMo-V2-Pro, 폰 회사 AI가 맞긴 한가요?

샤오미 MiMo-V2-Pro, 폰 회사 AI가 맞긴 한가요?

Hunter Alpha의 정체 — 가장 중요한 사실부터

1조 파라미터인데 비용이 이게 맞나요?

벤치마크 숫자 직접 뜯어봤습니다

OpenRouter 1위가 말해주는 것

샤오미가 아닌 이유가 되는 세 가지

실제 어떻게 쓸 수 있나요?

Q&A

마치며 — 총평

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기