Mistral Le Chat · Mistral Small 4 기준
Mistral Le Chat, 빠르다는 말이 전부가 아닙니다
1,000 단어/초라는 속도 수치, 한 번쯤 봤을 겁니다. 근데 그 속도가 Mistral 자체 인프라에서 나오는 게 아닙니다. 무료 플랜에서 월 10억 토큰이나 쓸 수 있다는 사실도, 실제 유저들이 구독을 취소하는 이유도 — 공식 문서와 실사용 데이터로 직접 확인했습니다.
Le Chat가 뭔지, 한 줄로 정리합니다
Mistral Le Chat는 프랑스 AI 스타트업 Mistral AI가 만든 AI 챗봇 서비스입니다. 2023년 Meta와 Google DeepMind 출신 연구자들이 창업한 회사로, ChatGPT처럼 텍스트 대화 인터페이스 안에서 웹 검색, 문서 분석, 이미지 생성, 코드 실행까지 한 번에 처리하는 올인원 도구입니다. 공식 출시는 2025년 2월이지만, 2026년 들어 유럽 AI 주권 논쟁과 맞물려 국내외 주목도가 부쩍 높아졌습니다.
핵심 차별점은 세 가지입니다. GDPR 준수, EU 데이터 주권, 그리고 학습에 대화를 사용하지 않는다는 개인정보 정책. 미국 서비스가 불편한 유럽 기업들이 실제로 쓰는 이유가 여기에 있습니다. AXA가 직원 14만 명에게 배포했고, CMA CGM은 전 세계 160개국 15만 5,000명에게 내부 AI 어시스턴트로 운용하고 있습니다. (출처: aionx.co, 2026.02.25)
기본 모델은 Mistral Large 3입니다. 6,750억 파라미터 중 실제 활성화되는 파라미터가 410억인 MoE(Mixture-of-Experts) 구조로 설계됐고, 128K 컨텍스트 윈도우를 지원합니다. 한국어도 공식 지원 언어 목록에 포함돼 있습니다. (출처: Mistral AI 공식 뉴스, mistral.ai/news/all-new-le-chat)
1,000 단어/초 — 이 속도는 어디서 나오는 걸까요?
Mistral이 공식 발표에서 내세우는 “초당 최대 1,000 단어(~1,000 wps)”는 실제 수치입니다. 그런데 이 숫자 뒤에 있는 구조가 흥미롭습니다. Mistral 자체 GPU가 아니라, 미국 반도체 기업 Cerebras Systems의 웨이퍼 스케일 칩(WSE) 위에서 추론을 돌리는 방식입니다. Cerebras CEO Andrew Feldman은 2025년 2월 공개 인터뷰에서 “빠르고 정확한 응답 제공이 이제 AI 개발의 핵심 초점”이라고 직접 밝혔습니다. (출처: Reuters, 2025.02.07 / dig.watch)
속도 1,000 wps는 Mistral 자체 인프라 개선이 아닌 Cerebras와의 파트너십으로 달성됐습니다. Cerebras는 Nvidia에 도전장을 내민 칩 회사인데, UAE 테크 기업 G42가 주요 투자자입니다. 즉 “유럽 AI”의 속도 기록이 미국·중동 자본의 칩 위에서 나온다는 구조입니다.
실제로 ChatGPT 대비 약 10배 빠르다는 수치가 여러 테스트에서 등장하지만, 이는 Flash Answers 모드 기준입니다. 복잡한 추론이 필요한 질문에서는 이 속도가 나오지 않고, 응답의 깊이가 속도와 반비례하는 경향이 있습니다. (출처: dataconomy.com, 2025.02.10)
빠른 게 항상 좋은 건 아닙니다. 속도와 깊이 사이의 절충점이 어디인지 파악하고 쓰는 게 맞습니다.
무료인데 이만큼 쓸 수 있다는 걸 모르는 경우가 많습니다
Mistral Le Chat 무료 플랜(Experiment Plan)의 공식 한도를 공식 문서에서 직접 뽑아봤습니다. 분당 2건 요청, 분당 50만 토큰, 그리고 월 10억 토큰입니다. 신용카드 없이 가입 즉시 사용 가능합니다. (출처: Mistral AI Rate Limits 공식 문서, docs.mistral.ai)
| 구분 | Le Chat 무료 | Le Chat Pro | ChatGPT Plus |
|---|---|---|---|
| 월 요금 | 무료 | $15 | $20 |
| 분당 요청 수 | 2건 | 무제한 | 제한 있음 |
| 월 토큰 한도 | 10억 토큰 | 무제한 | 미공개 |
| 학습 데이터 활용 | ❌ 안 씀 | ❌ 안 씀 | 옵트아웃 가능 |
| GDPR 준수 | ✅ | ✅ | 부분 |
월 10억 토큰이 감이 안 잡힐 수 있습니다. GPT-4o 기준으로 대화 1회에 평균 약 1,000토큰이 소모된다고 볼 때, 월 10억 토큰은 하루에 약 3만 3,000번 대화를 주고받을 수 있는 양입니다. 일반 사용자가 무료 한도에 막힐 가능성은 거의 없습니다.
ChatGPT Plus가 $20인데 Le Chat Pro는 $15, 무료 플랜도 이 정도면 — 가격만 놓고 보면 경쟁에서 질 이유가 없습니다. 그런데 실제 유저들은 왜 구독을 해지할까요.
메모리 기능, 켜두면 오히려 이상해지는 이유
Le Chat Pro에는 Memories(메모리) 기능이 있습니다. 대화 내용을 기억해 다음 대화에 반영하는 옵트인 기능인데, 공식 설명만 보면 매력적입니다. 근데 2026년 3월 기준 Reddit r/MistralAI에서 수십 명이 공통으로 지적한 문제가 있습니다. “의미 없는 것만 저장한다”는 겁니다. (출처: Reddit r/MistralAI, 2026.03.20)
Mistral은 Memories가 “사용자 선호도를 학습해 개인화된 추천을 가능하게 한다”고 공식 문서에 적어두었습니다. 그런데 실사용에서는 대화 맥락과 관계없는 단편적 정보들이 기억으로 저장되고, 이후 대화에서 이 잘못된 기억이 응답 품질을 오히려 낮추는 사례가 반복적으로 보고됩니다. 공식 기능 설명에 이 예외 조건은 명시돼 있지 않습니다.
실제로 유저 SilentCipher23은 “메모리가 중요하지 않은 것들을 저장하고 모든 것을 뒤섞는다”고 밝혔고, 또 다른 유저는 “Memories 옵션을 아예 꺼두는 게 낫다”고 조언했습니다. 이 부분은 Mistral AI가 공식 답변을 내놓지 않은 부분입니다. (출처: Reddit r/MistralAI, 2026.03.20)
메모리 기능을 켜두는 게 무조건 좋은 게 아닙니다. 특히 전문적인 작업이나 법률·의료 정보를 다룰 때는 메모리가 이전 대화의 맥락을 오염시킬 가능성을 먼저 고려해야 합니다.
2026년 3월 업데이트 — Voxtral TTS와 Mistral Small 4
공식 Changelog를 직접 확인하면 2026년 3월에만 굵직한 업데이트가 두 건 나왔습니다. 먼저 3월 23일 출시된 Voxtral TTS(voxtral-tts-2603)입니다. 제로샷 음성 클로닝, 다국어 지원, 실시간 스트리밍을 지원하는 오픈웨이트 TTS 모델로, 특히 음성 에이전트 개발용으로 포지셔닝됐습니다. 오픈소스로 공개된 TTS 모델 중에서 이 정도 사양은 드뭅니다. (출처: Mistral AI 공식 Changelog, docs.mistral.ai, 2026.03.23)
3월 16일에는 Mistral Small 4(mistral-small-2603)가 나왔습니다. 단일 모델에서 지시 따르기(instruct), 추론(reasoning), 코딩을 동시에 처리하는 하이브리드 구조이고 컨텍스트 윈도우가 256K까지 늘어났습니다. 기존 Small 3.1의 128K에서 2배 확장된 셈입니다. 긴 문서 요약이나 대용량 코드베이스 분석 시 실질적인 차이가 납니다.
3월 12일에는 Mistral Moderation 2603도 함께 배포됐고, Agents API와 Conversations API에서 커스텀 가드레일을 요청 단위로 설정할 수 있는 기능도 추가됐습니다. 한 달 안에 이만한 업데이트가 쌓였다는 건 개발 속도가 느리지 않다는 뜻입니다. (출처: Mistral AI 공식 Changelog, docs.mistral.ai)
벤치마크 1위인데 왜 유저들은 갈아타는 걸까요?
2026년 기준 ai-crucible.com 벤치마크에서 Mistral Large 3은 종합 9.4점으로 Claude Opus 4.5(9.2점)를 앞섭니다. 추론, GSM8K, AIME, 코딩 평가 전반에서 경쟁력 있는 수치를 보입니다. (출처: ai-crucible.com, 2026) 수치만 보면 Le Chat이 Claude보다 나은 것처럼 보입니다.
Reddit r/MistralAI(2026.03.21) 스레드에서 56개 댓글 중 가장 많은 공감을 받은 불만 두 가지는 ① “불릿 포인트를 멈추게 할 수가 없다”, ② “복잡한 논리·일관성에서 자꾸 실수한다”입니다. 벤치마크가 측정하는 항목과 실제 작업 흐름 사이의 간격이 여기서 나옵니다.
API 비용 측면에서는 확실한 우위가 있습니다. AI 벤치마크 비교 자료에 따르면 동일 품질 대비 Mistral Large 3의 API 가격은 Claude 대비 약 14배 저렴합니다. (출처: ai-crucible.com, 2026) 대용량 API 요청을 다루는 개발자나 기업이라면 이 차이가 월 비용에서 실제로 체감됩니다.
코딩에서는 Codestral 모델이 별도로 존재하는데, LMArena 리더보드 기준 오픈소스 코딩 모델 1위입니다. 단, 복잡한 멀티스텝 디버깅에서 ChatGPT o1 대비 맥락 이해가 떨어진다는 지적이 여러 비교 테스트에서 공통적으로 나옵니다. (출처: index.dev, 2026)
결론적으로 Le Chat은 빠른 정보 조회, 문서 처리, GDPR이 중요한 환경, API 비용 최적화가 필요한 대규모 운용에 잘 맞습니다. 복잡한 추론, 긴 창작 작업, 모바일 중심 사용에서는 여전히 아쉬운 부분이 남습니다.
Q&A
마치며
Mistral Le Chat은 확실히 저평가된 도구입니다. 무료 플랜에서 월 10억 토큰, $15짜리 Pro 플랜, GDPR 준수 — 수치만 봐도 가성비는 나무랄 데가 없습니다. 3월 한 달 동안 Voxtral TTS, Mistral Small 4, Moderation API까지 밀어붙이는 개발 속도도 인상적입니다.
그런데 솔직히 말하면, 지금 당장 ChatGPT나 Claude의 완전한 대안으로 쓰기엔 복잡한 추론과 응답 일관성 면에서 아직 한 발짝 뒤에 있습니다. 속도 1,000 wps도 자체 기술이 아닌 Cerebras 칩 위에서 나오는 수치이고, 메모리 기능도 설계 의도와 실제 작동 사이에 거리가 있습니다.
가장 잘 맞는 시나리오는 명확합니다. 빠른 정보 검색, PDF·문서 대량 처리, GDPR이 필요한 환경, API 비용을 줄여야 하는 대규모 운용 — 여기선 확실히 씁니다. 깊은 분석이나 복잡한 창작 작업은 다른 도구와 병행하는 게 현실적입니다.
📎 본 포스팅 참고 자료
- Mistral AI 공식 뉴스 — The all new le Chat (mistral.ai)
- Mistral AI 공식 Changelog (docs.mistral.ai)
- Mistral AI Full Review and Comparison — AIonX (aionx.co, 2026.02.25)
- Reddit r/MistralAI — Are you satisfied with Le Chat? (2026.03.20)
- Cerebras powers Mistral’s Le Chat to claim AI speed record (dig.watch, 2025.02.08)
※ 본 포스팅은 2026년 4월 1일 기준으로 작성됐습니다. Mistral AI의 서비스 정책·요금·UI·기능은 업데이트에 따라 언제든 변경될 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있으며, 최신 정보는 공식 홈페이지(mistral.ai)에서 확인하세요.











댓글 남기기