GLM-5 무료 사용법: 4월 30일 전 안 쓰면 손해

Published on

in

GLM-5 무료 사용법: 4월 30일 전 안 쓰면 손해

▶ 오픈소스 AI 완전 정복 | 2026년 3월 기준

GLM-5 무료 사용법: 4월 30일 전 안 쓰면 손해

월 구독료 $0으로 Claude Opus 4.6 수준의 오픈소스 최강 AI를 쓸 수 있습니다.
Modal API 무료 기간이 2026년 4월 30일로 종료되기 전, 지금 바로 설정하세요.

SWE-bench 77.8%
745B 파라미터
MIT 라이선스
OpenAI API 호환
무료 마감: 2026.04.30

GLM-5가 뭔데 다들 난리인가요?

2026년 2월 11일, 중국 AI 스타트업 Z.ai가 공개한 GLM-5 무료 사용법이 개발자 커뮤니티를 강타했습니다. 단순한 오픈소스 모델 출시가 아닙니다. 745B(7,450억 개) 파라미터를 가진 초거대 모델이 MIT 라이선스로 공개되었고, 심지어 Modal 플랫폼을 통해 2026년 4월 30일까지 완전 무료로 API 호출이 가능해졌습니다.

GLM-5는 단순히 규모만 큰 모델이 아닙니다. 이전 버전인 GLM-4.7 대비 파라미터는 355B → 745B로 두 배 이상 늘었고, 사전학습 데이터도 23T → 28.5T 토큰으로 확장되었습니다. 핵심은 비동기 강화학습 프레임워크 “Slime”의 도입인데, 이를 통해 복잡한 시스템 엔지니어링 작업에서 질적으로 다른 성능 도약을 이루었습니다.

제 개인적인 시각으로는, 이번 GLM-5 공개는 단순한 모델 업데이트가 아니라 “오픈소스가 상용 최강 모델을 따라잡았다”는 상징적 사건입니다. SWE-bench Verified 점수 77.8%는 Claude Opus 4.6의 80.9%에 불과 3%p 차이입니다. 상용 모델에 월 $20~$200을 내고 쓸 이유가 점점 흐릿해지고 있습니다.

항목 GLM-4.7 GLM-5
파라미터 (총/활성) 355B / 32B 745B / 40B
사전학습 데이터 23T 토큰 28.5T 토큰
컨텍스트 길이 128K 200K
라이선스 MIT MIT (상업 가능)
강화학습 프레임워크 표준 RL Slime (비동기 RL)

출처: Hugging Face — zai-org/GLM-5

성능 비교: Claude·GPT-5.3 vs GLM-5 솔직 분석

GLM-5의 가장 인상적인 점은 오픈 웨이트 모델 중 최초로 상용 최강 모델과 실질적 격차를 좁힌 것입니다. 업계 표준 벤치마크인 SWE-bench Verified(실제 GitHub 이슈 기반 소프트웨어 엔지니어링 테스트)에서 77.8%를 기록, 오픈소스 모델 중 역대 최고 점수입니다. Claude Opus 4.6의 80.9%와는 불과 3.1%p 차이입니다.

특히 눈에 띄는 것은 BrowseComp 벤치마크입니다. 웹 검색 및 정보 종합 능력을 평가하는 이 지표에서 GLM-5는 62.0%로 Claude Opus 4.6의 37.0%를 압도했습니다. 즉, 웹 검색 연동 에이전트 작업에서는 GLM-5가 오히려 훨씬 강합니다. MCP-Atlas(도구 호출 및 다단계 작업) 에서도 GLM-5가 67.8%로 Claude Opus 4.6의 65.2%를 웃돕니다.

벤치마크 GLM-5 GLM-4.7 DeepSeek-V3.2 Claude Opus 4.6
SWE-bench Verified 77.8 73.8 73.1 80.9
Terminal-Bench 2.0 56.2 41.0 39.3 59.3
BrowseComp (웹 검색) 62.0 🏆 52.0 51.4 37.0
MCP-Atlas (도구 호출) 67.8 🏆 52.0 62.2 65.2

💡 인사이트: 코딩 작업 단일 측정치만 보면 Claude가 우세하지만, 웹 검색 연동 에이전트·도구 호출 능력은 GLM-5가 오히려 앞섭니다. 자동화 에이전트를 구축하려는 개발자라면 GLM-5가 훨씬 실용적일 수 있습니다.

가장 쉬운 방법: z.ai에서 바로 무료 체험

GLM-5 무료 사용법 중 가장 간단한 방법은 z.ai 공식 웹사이트를 이용하는 것입니다. 별도의 설치나 API 설정 없이 브라우저 하나로 즉시 사용할 수 있습니다. ChatGPT나 Claude 웹 인터페이스와 거의 동일한 UX입니다.

z.ai 접속 3단계

  1. 1단계 — 접속: 브라우저에서 https://chat.z.ai 에 접속합니다.
  2. 2단계 — 가입: 구글 계정 또는 이메일로 무료 회원가입을 진행합니다.
  3. 3단계 — 모델 선택: 채팅 창 상단에서 “GLM-5″를 선택 후 바로 대화를 시작합니다.

⚠️ z.ai 무료 플랜 주의사항: 일일 사용량 제한이 있으며, 복잡한 에이전트 작업보다 단일 대화 용도에 적합합니다. API 연동이나 장시간 에이전트 작업이 필요하다면 다음 섹션의 Modal API 방법을 이용하세요.

z.ai에서는 GLM-5 외에도 경량 버전인 GLM-4.7GLM-4.7-Flash도 무료로 사용 가능합니다. 단순 질문 답변이나 코드 스니펫 생성 정도의 작업이라면 Flash 버전이 훨씬 빠르게 응답합니다. 실제로 저는 GLM-4.7-Flash로 간단한 파이썬 스크립트를 생성할 때 Claude보다 오히려 응답 속도가 더 빠른 경험을 했습니다.

Modal API로 4월 30일까지 완전 무료 사용하는 법

Z.ai는 GLM-5 공개에 앞서 클라우드 GPU 플랫폼 Modal과 파트너십을 맺었습니다. 그 결과 2026년 4월 30일까지 GLM-5 API 호출이 완전 무료로 제공됩니다. 토큰 수 제한이 없고, 초당 30~75 토큰 생성 속도를 자랑하며, OpenAI API와 완전히 호환되기 때문에 기존에 ChatGPT API를 쓰던 코드를 거의 그대로 재사용할 수 있습니다.

📌 Modal GLM-5 무료 API 사양 요약
• 무료 기간: 2026년 4월 30일까지
• API 호환성: OpenAI API 완전 호환
• 동시 요청: 개인용 1개 동시 요청 제한
• 토큰 제한: 없음(토큰 무제한)
• 생성 속도: 초당 30~75 토큰
• Base URL: https://api.us-west-2.modal.direct/v1

Modal API 키 발급 순서

  1. 1단계 — Modal 가입: https://modal.com 접속 → GitHub 계정으로 1분 가입 완료
  2. 2단계 — GLM-5 토큰 발급: 대시보드 → GLM-5 엔드포인트 페이지(modal.com/glm-5-endpoint)에서 API 토큰 생성
  3. 3단계 — 토큰 안전 저장: 발급된 토큰은 재확인 불가 — 반드시 즉시 복사해서 저장
  4. 4단계 — 환경 변수 설정: 아래 코드 참고

# Linux / macOS — ~/.bashrc 또는 ~/.zshrc 에 추가

export LLM_BACKEND_API_KEY="modal_research_xxxxx...발급받은_토큰"

# Windows PowerShell

$env:LLM_BACKEND_API_KEY="modal_research_xxxxx...발급받은_토큰"

# Python에서 직접 호출 예시 (OpenAI 라이브러리 재활용)

from openai import OpenAI
client = OpenAI(
base_url="https://api.us-west-2.modal.direct/v1",
api_key="modal_research_xxxxx...발급받은_토큰"
)
response = client.chat.completions.create(
model="zai-org/GLM-5-FP8",
messages=[{"role": "user", "content": "안녕하세요! 소개 부탁드립니다."}]
)
print(response.choices[0].message.content)

환경 변수 적용 후에는 반드시 터미널을 재시작하거나 source ~/.bashrc 명령을 실행해야 변경사항이 반영됩니다. Python으로 위의 코드를 실행했을 때 GLM-5의 자기소개가 출력되면 설정이 정상적으로 완료된 것입니다.

OpenClaw에 GLM-5 연동하는 단계별 설정법

OpenClaw는 WhatsApp, Slack, Discord 등 다양한 메신저와 AI를 연결하고, 파일 시스템·웹 검색·코드 실행 등의 도구를 통합하는 오픈소스 AI 에이전트 프레임워크입니다. 기본적으로 Claude나 GPT-5를 쓰도록 설계되어 있지만, OpenAI API 호환 포맷이라면 어떤 모델이든 연결할 수 있습니다. 바로 Modal의 GLM-5가 여기에 딱 맞습니다.

설정 파일 위치 확인

OpenClaw 설정 파일(openclaw.json)의 기본 경로입니다.

# Linux / macOS
~/.openclaw/openclaw.json
# Windows
C:\Users\{사용자명}\.openclaw\openclaw.json

openclaw.json 설정 추가 코드

models 섹션의 providers에 아래 내용을 추가합니다.

{
"models": {
"mode": "merge",
"providers": {
"modal": {
"baseUrl": "https://api.us-west-2.modal.direct/v1",
"apiKey": "${LLM_BACKEND_API_KEY}",
"api": "openai-completions",
"models": [
{
"id": "zai-org/GLM-5-FP8",
"name": "GLM-5",
"reasoning": true,
"input": ["text"],
"cost": {
"input": 0,
"output": 0,
"cacheRead": 0,
"cacheWrite": 0
},
"contextWindow": 192000,
"maxTokens": 8192
}
]
}
}
}
}

💡 설정 핵심 포인트
"mode": "merge" — 기존 모델 목록에 GLM-5를 추가(덮어쓰기 아님)
"api": "openai-completions" — OpenAI 호환 형식 명시 필수
"reasoning": true — 추론 모드 활성화, 복잡한 작업에서 품질 향상
"cost" 항목을 모두 0으로 설정해야 무료로 인식됨

설정 후 OpenClaw를 재시작하면 채팅 창의 모델 선택 드롭다운에서 “GLM-5”가 표시됩니다. openclaw models list 명령어로 연결 상태를 확인할 수 있습니다. 실제로 이 설정을 사용한 Reddit 커뮤니티 사용자들이 “API 비용이 6배 줄었는데 성능은 거의 동일하다”고 보고하고 있어서, 개발 프로젝트에 부담 없이 AI를 적용하고 싶은 분들에게 강력히 추천합니다.

GLM-5 활용 꿀팁: 이 세 가지만 기억하세요

GLM-5는 모든 작업에서 만능이 아닙니다. 강점과 약점을 알고 써야 실망 없이 최대 효율을 낼 수 있습니다. 직접 테스트와 커뮤니티 후기를 종합해 세 가지 핵심 활용 전략을 정리했습니다.

TIP 1

에이전트·자동화 작업에는 GLM-5를 우선 투입하세요

BrowseComp 62.0%, MCP-Atlas 67.8%에서 확인되듯, GLM-5는 웹 검색 연동·다단계 도구 호출에서 Claude를 앞섭니다. 정기적으로 웹에서 데이터를 수집하거나, 여러 API를 순서대로 호출하는 자동화 파이프라인 구축에 탁월합니다. 비용까지 공짜이니 Claude API 사용량을 크게 줄일 수 있습니다.

TIP 2

Thinking Mode를 반드시 켜세요 — 복잡한 작업의 품질 차이가 큽니다

GLM-5는 내부 추론 과정을 거쳐 답변하는 Thinking Mode를 지원합니다. OpenClaw 설정에서 "reasoning": true를 적용하면 자동으로 활성화됩니다. 단순 Q&A는 속도가 오히려 느려질 수 있지만, 복잡한 아키텍처 설계나 디버깅 작업에서는 체감할 수 있는 품질 차이가 납니다.

TIP 3

UI/디자인 산출물은 Claude에게 맡기세요

Reddit 커뮤니티의 실제 사용 후기를 보면 “GLM-5는 훌륭한 모델이지만 디자인 실력이 별로”라는 평이 있습니다. 프론트엔드 UI 컴포넌트나 시각적 레이아웃 코드 생성에서는 Claude가 여전히 우세합니다. 백엔드 로직·API 설계는 GLM-5로, 프론트엔드 UI는 Claude로 역할을 나눠 쓰는 전략이 가장 비용 효율적입니다.

자주 묻는 질문 5가지

Q1. GLM-5 무료 기간이 4월 30일 이후에도 무료인가요?

Modal 플랫폼의 GLM-5 무료 제공은 공식적으로 2026년 4월 30일까지로 명시되어 있습니다. 이후에는 유료로 전환될 가능성이 높습니다. 단, Z.ai 공식 웹사이트인 chat.z.ai의 무료 플랜은 사용량 제한 내에서 계속 무료로 유지될 수 있습니다. 지금 Modal API 키를 발급받아 프로젝트에 미리 통합해 두는 것이 현명합니다.

Q2. GLM-5를 로컬에서 직접 실행할 수 있나요?

이론적으로는 가능하지만 현실적으로 매우 어렵습니다. GLM-5는 FP8 양자화 상태에서도 약 700GB의 저장 공간이 필요하며, A100 80GB GPU 8장 이상을 요구합니다. 이는 월 수천만 원에 해당하는 비용입니다. 개인 개발자나 스타트업은 Modal API 또는 z.ai를 통한 클라우드 접근이 현실적인 선택입니다.

Q3. GLM-5의 MIT 라이선스는 상업적으로도 사용 가능한가요?

네, MIT 라이선스는 상업적 사용을 포함한 거의 모든 용도를 허용합니다. 다만 Modal API를 통해 무료로 사용하는 경우 Modal의 서비스 약관(무료 기간 내 개인·소규모 사용 기준)을 별도로 확인하시기 바랍니다. 대규모 프로덕션 환경이라면 Z.ai 공식 엔터프라이즈 플랜을 검토하세요.

Q4. OpenRouter를 통해 GLM-5를 사용하는 더 간단한 방법은 없나요?

있습니다. OpenRouter 계정이 이미 있다면 훨씬 간편합니다. OpenClaw 설정에서 openrouter/zai/glm-5 형식으로 모델 ID를 지정하면 됩니다. 단, OpenRouter는 무료 티어에서 사용량 제한이 있으며, GLM-5는 무료 모델이 아닐 수 있습니다. 순수 무료를 원한다면 Modal API 방법이 확실합니다.

Q5. GLM-5가 한국어를 잘 처리하나요?

GLM 시리즈는 중국어 기반으로 개발되었지만, 28.5T 토큰 규모의 다국어 사전학습 데이터 덕분에 한국어 처리 품질이 GPT-4o 수준에 근접합니다. 다만 한국어 문체의 자연스러움은 Claude보다 다소 딱딱할 수 있습니다. 한국어 코드 주석 생성·번역·기술 문서 작성에는 충분히 활용 가능하며, 창의적인 한국어 글쓰기에는 Claude를 병용하는 것을 권장합니다.

마치며 — 4월 30일 전에 세팅 끝내야 하는 이유

GLM-5는 단순히 “무료라서 써볼 만한 AI”가 아닙니다. 오픈소스 모델이 상용 최강 모델과 실질적으로 동등한 수준에 도달했다는 역사적 전환점입니다. SWE-bench 77.8%, BrowseComp 62.0%(Claude 37.0% 압도), MCP-Atlas 67.8%는 단순한 숫자가 아니라 “이제 AI 구독료를 내지 않아도 된다”는 신호입니다.

물론 디자인 감각이나 창의적 글쓰기 영역에서는 Claude가 여전히 우세합니다. 하지만 코드 생성, 시스템 설계, 에이전트 자동화, 기술 문서 작성 등 개발 업무의 80% 이상은 GLM-5가 충분히 커버합니다. 저는 이 변화가 앞으로 6개월 안에 개발자들의 AI 도구 선택 기준을 완전히 바꿀 것이라고 봅니다.

지금 당장 ① z.ai 가입 → ② Modal API 키 발급 → ③ OpenClaw 연동, 이 세 단계를 오늘 안에 끝내세요. 4월 30일 무료 기간이 끝나기 전에 프로젝트에 통합해 두면, 이후 비용 전환이 되더라도 이미 검증된 파이프라인을 유지할 수 있습니다. 미리 세팅한 사람만 손해를 피할 수 있습니다.

본 포스팅의 벤치마크 수치 및 무료 정책은 2026년 3월 9일 기준이며, 이후 변경될 수 있습니다. Modal API 무료 기간, z.ai 요금제 등은 각 서비스 공식 웹사이트에서 최신 내용을 반드시 확인하세요. 본 글은 특정 서비스의 유료 홍보가 아닌 공개 정보를 기반으로 작성된 정보 제공 목적의 콘텐츠입니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기