2026년 2월 12일 출시 · 오픈소스 MIT 라이선스
GLM-5 완전 정복: Z.ai 무료 체험부터
Claude Code 연동까지
유료 Claude·GPT를 쓰던 개발자들이 지금 조용히 갈아타고 있는 모델이 있습니다.
744B 파라미터, MIT 오픈소스, 4월 30일까지 완전 무료.
GLM-5의 실체를 지금 바로 정리합니다.
SWE-bench 77.8점
192K 컨텍스트
4월 30일까지 무료
MIT 라이선스
GLM-5란 무엇인가 — 세상이 주목한 진짜 이유
2026년 2월 12일, 중국 AI 기업 Zhipu AI(지푸 AI)가 운영하는 Z.ai 플랫폼이 GLM-5를 공개했습니다. 단순한 오픈소스 모델 하나가 나온 게 아닙니다. 그날 하루, AI 커뮤니티는 Reddit·X·YouTube 할 것 없이 “무료인데 Claude Opus 4.5에 근접한다”는 반응으로 들끓었습니다. 이유는 딱 하나였습니다. 상업적 활용까지 허용하는 MIT 라이선스로 공개된 744B 파라미터 모델이 등장한 것 자체가 충격적이었기 때문입니다.
GLM 시리즈는 General Language Model의 약자로, Zhipu AI가 칭화대학교와 공동 개발한 LLM 계보입니다. GLM-4.5에서 GLM-5로 넘어오면서 파라미터는 355B에서 744B로 두 배 이상 증가했고, 사전 학습 데이터도 23조 토큰에서 28.5조 토큰으로 확장됐습니다. 단순히 규모를 키운 것이 아니라 에이전트 엔지니어링(Agentic Engineering)이라는 새로운 설계 철학을 전면에 내세웠다는 점이 핵심입니다. 명령에 반응하는 AI가 아니라, 스스로 계획하고 장기 과제를 완수하는 AI를 목표로 만들었다는 선언입니다.
개인적으로 주목한 부분은 이 모델이 단순히 벤치마크 점수를 위한 것이 아니라는 점입니다. 실제로 .docx·.xlsx·.pdf 파일을 직접 생성하고, Claude Code·OpenClaw 같은 실무 도구와 즉시 연동되도록 설계됐다는 사실이 기존 오픈소스 모델들과 결정적으로 다른 점입니다.
핵심 기술 해부 — DSA·슬라임·MoE의 실체
GLM-5를 이해하려면 세 가지 기술을 알아야 합니다. 처음 들으면 어렵게 느껴지지만, 원리만 이해하면 “왜 이 모델이 저렴하고 빠를 수 있는지”가 명확해집니다.
① MoE (Mixture-of-Experts) 아키텍처
744B 파라미터라는 숫자에 놀랄 필요는 없습니다. MoE 구조에서는 모든 파라미터가 동시에 활성화되지 않습니다. 실제로 한 번의 추론에 활성화되는 파라미터는 40B에 불과합니다. 코딩 작업에는 코딩 전문가 그룹을, 창작 작업에는 창작 전문가 그룹을 선택적으로 호출하는 방식입니다. 결과적으로 744B 수준의 지식을 보유하면서 40B 모델 수준의 연산 비용으로 동작합니다.
② DSA (DeepSeek Sparse Attention)
긴 문서를 처리할 때 기존 어텐션 메커니즘은 모든 토큰 쌍의 관계를 계산합니다. 문서 길이가 2배가 되면 연산량은 4배가 되는 구조입니다. DSA는 중요한 토큰 관계에만 집중해 연산량을 획기적으로 줄입니다. GLM-5가 192K 토큰이라는 방대한 컨텍스트 윈도우를 지원하면서도 배포 비용을 낮출 수 있는 핵심 이유가 바로 이것입니다.
③ SLIME (비동기 강화학습 인프라)
강화학습은 AI가 시행착오를 통해 스스로 개선하는 방법입니다. 그러나 대규모 LLM에 강화학습을 적용하면 훈련 효율이 크게 떨어지는 문제가 있었습니다. Z.ai는 비동기 처리 방식의 새로운 강화학습 인프라 SLIME을 자체 개발해 이 문제를 해결했습니다. 교과서를 읽으며 기초를 쌓는 사전학습만으로는 ‘유능’에 그칠 수 있지만, SLIME 기반의 사후학습이 모델을 ‘탁월함’으로 끌어올리는 역할을 합니다.
💡 핵심 인사이트: GLM-5의 경쟁력은 단순히 ‘크기’가 아닙니다. MoE로 비용을 낮추고, DSA로 긴 문맥을 처리하며, SLIME으로 실무 능력을 높인 세 기술의 조합이 진짜 경쟁력입니다. 이 조합이 “오픈소스인데 왜 이렇게 잘하지?”라는 반응을 끌어낸 이유입니다.
벤치마크로 보는 성능 — Claude·GPT와 정면 비교
GLM-5의 공식 발표 자료와 Z.ai 블로그, ZDNet 보도를 종합하면 아래와 같은 성능 비교가 가능합니다. 숫자가 모든 것을 말해주지는 않지만, 방향성은 분명합니다.
| 벤치마크 | GLM-5 | GLM-4.7 | Claude Opus 4.5 | 비고 |
|---|---|---|---|---|
| HLE (추론·텍스트) | 30.5 | 24.8 | ~36 (추정) | 고난도 추론 |
| HLE (도구 포함) | 50.4 | — | ~55 (추정) | 오픈소스 1위 |
| SWE-bench Verified | 77.8% | ~65% | ~80% | 코드 버그 수정 |
| Vending Bench 2 | $4,432 | — | $4,967 | 장기 계획·운영 |
| 컨텍스트 윈도우 | 192K | 128K | 200K | 토큰 기준 |
| 라이선스 | MIT (오픈소스) | MIT | 상용 | 상업 활용 가능 |
※ Claude Opus 4.5 수치는 Z.ai 공식 블로그 및 ZDNet 보도 참조. 추정치 포함.
Vending Bench 2 결과가 특히 인상적입니다. 이 벤치마크는 AI가 1년 동안 가상의 자판기 사업을 운영하며 최종 계좌 잔액을 얼마나 늘리는지를 평가하는 것으로, 장기적 계획 수립과 자원 관리 능력을 측정합니다. GLM-5는 오픈소스 모델 중 1위를 기록하며, Claude Opus 4.5의 $4,967에 $535 차이($4,432)까지 좁혔습니다. 단순 대화 능력이 아닌 실제 업무 완수 능력이라는 점에서 의미가 다릅니다.
API 비용 측면에서도 GLM-5는 경쟁력이 있습니다. 입력 토큰 100만 개당 약 $0.80~$1.00, 출력 100만 개당 $2.56~$3.20으로 책정되어 있습니다. Claude Opus 4.5 대비 약 5~7배 저렴한 수준입니다. 실제로 OpenClaw를 GLM-5로 교체한 사용자들이 “API 비용이 6배 줄었다”는 후기를 공유하고 있을 정도입니다.
지금 당장 무료로 쓰는 법 — Z.ai·Modal·API 3가지 루트
GLM-5를 사용하는 방법은 크게 세 가지입니다. 목적에 따라 적합한 루트를 선택하면 됩니다.
1
Z.ai 웹사이트 — 가장 간단한 무료 체험
z.ai에 접속해 회원가입 후 모델 옵션에서 GLM-5를 선택하면 됩니다. Chat 모드와 Agent 모드를 모두 지원하며, Agent 모드에서는 PDF/Word/Excel 파일 생성까지 가능합니다. 가장 빠르게 GLM-5를 체험할 수 있는 방법으로, 별도 설정이 전혀 필요 없습니다.
2
Modal API — 4월 30일까지 완전 무료 (개발자 추천)
Modal 플랫폼이 Z.ai와 파트너십을 맺어 2026년 4월 30일까지 GLM-5 API를 완전 무료로 제공합니다. OpenAI 호환 API 형식을 지원하므로 기존 GPT API를 사용하던 코드를 거의 수정 없이 활용할 수 있습니다.
Base URL: https://api.us-west-2.modal.direct/v1
Model ID: zai-org/GLM-5-FP8
# 동시 요청: 1개 / 생성 속도: 30~75 토큰/초
⚠ 동시 요청 1개 제한 — 개인 개발·학습 용도에 최적. 프로덕션은 유료 플랜 권장.
3
Z.ai 공식 API (api.z.ai) — 유료지만 GPT·Claude보다 저렴
본격적인 서비스 개발에는 api.z.ai 공식 API를 활용할 수 있습니다. GLM Coding Plan은 월 $10부터 시작하며, Claude Code·OpenCode·Kilo Code·Cline 등 주요 코딩 에이전트와의 공식 연동을 지원합니다. 입력 $0.80/1M 토큰, 출력 $2.56/1M 토큰 기준으로 Claude Opus 4.5 대비 약 6배 저렴합니다.
from openai import OpenAI
client = OpenAI(
api_key=“your-Z.AI-api-key”,
base_url=“https://api.z.ai/api/paas/v4/”
)
completion = client.chat.completions.create(
model=“glm-5”,
messages=[{“role”: “user”, “content”: “안녕!”}]
)
Claude Code·OpenClaw 연동 실전 가이드
GLM-5의 진가는 코딩 에이전트와 연동했을 때 드러납니다. Claude Code를 GLM-5로 교체하면 월 구독 비용을 최대 7배까지 줄일 수 있다는 한국 개발자들의 실험 결과가 이미 여럿 공유되고 있습니다. 방법은 생각보다 간단합니다.
Claude Code에 GLM-5 연동하기
Claude Code 설정 파일(~/.claude/settings.json)에서 모델 이름을 변경하거나, Z.ai Coding Max 플랜 가입 후 아래와 같이 설정하면 됩니다.
{
“model”: “GLM-5”
}
OpenClaw에 Modal GLM-5 연동하기 (무료)
OpenClaw 설정 파일(~/.openclaw/openclaw.json)의 models 섹션에 아래 내용을 추가합니다. 환경 변수로 API 키를 관리하는 것이 보안상 필수입니다.
“models”: {
“mode”: “merge”,
“providers”: {
“modal”: {
“baseUrl”: “https://api.us-west-2.modal.direct/v1”,
“apiKey”: “${LLM_BACKEND_API_KEY}”,
“api”: “openai-completions”,
“models”: [{
“id”: “zai-org/GLM-5-FP8”,
“name”: “GLM-5”,
“contextWindow”: 192000,
“cost”: { “input”: 0, “output”: 0 }
}]
}
}
}
}
💡 현실적인 조언: OpenClaw나 Claude Code의 성능은 결국 어떤 LLM을 백엔드로 쓰느냐에 달려 있습니다. GLM-5는 코딩·시스템 엔지니어링에서 Claude Opus 4.5에 근접하는 성능을 보이므로, 비용 절감이 우선인 개인 개발자라면 4월 30일 무료 기간 동안 충분히 테스트해볼 가치가 있습니다.
GLM-5가 진짜 잘하는 것 vs 아직 부족한 것
어떤 도구든 맹신은 금물입니다. GLM-5의 실제 강점과 한계를 솔직하게 정리했습니다.
✅ GLM-5가 진짜 잘하는 것
- 복잡한 코드 시스템 설계·디버깅
- 장기 프로젝트 계획·관리 (192K 컨텍스트)
- .docx/.xlsx/.pdf 완성 문서 생성
- 오픈소스 모델 중 에이전트 작업 최상위
- MIT 라이선스 — 상업 서비스 통합 가능
- NVIDIA 외 화웨이·삼성 칩에서도 실행 가능
⚠ 아직 주의가 필요한 것
- 한국어 섬세한 뉘앙스 표현 (영어 대비 약세)
- 로컬 실행 사실상 불가 (~700GB 필요)
- Modal 무료 API 동시 요청 1개 제한
- 이미지 생성·멀티모달 기능 제한적
- 중국 기업 운영 — 데이터 정책 확인 필요
중국 기업이 만든 모델이라는 점에서 데이터 프라이버시를 우려하는 시각도 있습니다. 민감한 기업 데이터를 다룬다면 로컬 배포 또는 Modal API를 활용해 중립적인 클라우드 환경에서 실행하는 것이 현명합니다. 반면 공개 코드 기반의 사이드 프로젝트나 개인 개발 용도라면 MIT 오픈소스 모델을 굳이 거부할 이유가 없습니다. 데이터 성격에 따라 사용처를 구분하는 전략이 가장 합리적입니다.
자주 묻는 질문 5선
Q1. GLM-5는 정말 완전 무료로 쓸 수 있나요?
Z.ai 웹사이트에서의 Chat/Agent 모드 체험은 무료입니다. 또한 Modal 플랫폼을 통해 2026년 4월 30일까지 API를 무료로 사용할 수 있습니다. 단, Modal의 무료 API는 동시 요청 1개로 제한됩니다. 대용량 프로덕션 서비스에는 Z.ai 공식 유료 API($10/월~) 사용을 권장합니다.
Q2. GLM-5를 로컬 PC에 직접 설치할 수 있나요?
이론적으로는 가능하지만 현실적으로는 매우 어렵습니다. FP8 양자화 상태에서도 약 700GB의 스토리지와 대용량 VRAM이 필요합니다. HuggingFace·ModelScope에서 가중치를 다운로드할 수 있고, vLLM·SGLang 프레임워크를 통한 배포가 지원되지만, 일반 개인 PC 환경에서는 사실상 불가능합니다. Modal API나 Z.ai API를 통한 클라우드 접근이 현실적인 선택입니다.
Q3. Claude Code에서 GLM-5로 교체하면 성능이 얼마나 차이 나나요?
코딩 및 시스템 엔지니어링 작업에서는 GLM-5가 Claude Opus 4.5에 근접하는 성능을 보입니다. SWE-bench Verified 기준 GLM-5는 77.8%로 Claude Opus 4.5 대비 약 2~3% 낮은 수준입니다. 단순 반복 코드 생성이나 백엔드 로직 작성에서는 체감 차이가 크지 않다는 사용자 후기가 많습니다. 반면 복잡한 추론이나 한국어 뉘앙스가 중요한 작업은 Claude 계열이 여전히 앞섭니다.
Q4. MIT 라이선스라면 GLM-5를 내 상업 서비스에 써도 되나요?
네, MIT 라이선스는 상업적 활용을 허용합니다. 모델 가중치를 수정하거나 자체 서버에 배포하는 것도 가능합니다. 다만 API를 통해 Z.ai 플랫폼을 이용하는 경우에는 Z.ai의 이용약관을 별도로 확인해야 합니다. 자체 서버에 직접 배포해 사용하는 경우라면 MIT 라이선스 조건만 준수하면 됩니다.
Q5. GLM-5와 DeepSeek-V3.2 중 어느 것이 더 낫나요?
용도에 따라 다릅니다. 장기 에이전트 작업과 복잡한 시스템 엔지니어링에는 GLM-5가 우세합니다(Vending Bench 2 오픈소스 1위). 수학·추론 및 일반 코딩에서는 DeepSeek-V3.2가 경쟁력을 보입니다. 둘 다 무료 API를 제공하므로 직접 테스트해보는 것이 가장 정확합니다. 현재 글로벌 개발자들 사이에서는 “코딩 에이전트엔 GLM-5, 빠른 수학 계산엔 DeepSeek”이라는 실용적 분업 사용이 퍼지고 있습니다.
마치며 — GLM-5가 바꾸는 것
GLM-5의 등장이 의미하는 바는 단순히 “또 하나의 좋은 오픈소스 모델이 나왔다”가 아닙니다. 744B 규모의 모델이 MIT 라이선스로 공개되고, 실무 파일 생성과 에이전트 작업에서 최상위 상용 모델에 근접한다는 것 자체가 게임의 규칙을 바꾸는 사건입니다.
유료 LLM에 매달 상당한 비용을 지출하던 개인 개발자와 스타트업 입장에서는 이 모델의 등장이 반갑지 않을 리 없습니다. 특히 4월 30일까지 Modal API를 통해 완전 무료로 사용할 수 있는 기회는 지금 당장 놓쳐서는 안 됩니다. GLM-5로 코딩 에이전트를 구동해보고, 비용 대비 성능이 맞는다면 전환을 검토하는 것이 합리적인 선택입니다.
한 가지 당부하자면, 중국 기업 운영 플랫폼이라는 점에서 민감한 개인·기업 데이터를 그대로 입력하는 것은 피해야 합니다. 공개 코드 기반 작업에 GLM-5를 활용하고, 보안이 중요한 내부 데이터는 여전히 신중한 플랫폼 선택이 필요합니다. 도구는 올바르게 쓰는 사람에게 힘이 됩니다. GLM-5도 마찬가지입니다.
※ 본 포스팅은 2026년 3월 9일 기준 공개된 정보를 토대로 작성되었습니다. GLM-5 성능 수치는 Z.ai 공식 블로그 및 ZDNet 보도를 참조하였으며, 일부 수치는 추정치가 포함될 수 있습니다. Modal 무료 API 제공 조건(4월 30일까지)은 사전 고지 없이 변경될 수 있으므로 사용 전 공식 페이지를 확인하시기 바랍니다. 외부 서비스 이용 시 각 플랫폼의 이용약관 및 개인정보처리방침을 반드시 확인하십시오.











댓글 남기기