Grok 4.1 Fast / Grok 4 기준
xAI 공식 문서 출처
Grok API 가격, 싸다고 골랐다간 이 조건에서 막힙니다
토큰 단가만 보면 Grok 4.1 Fast는 지금 시장에서 가장 저렴한 프런티어급 모델 중 하나입니다. 그런데 실제로 프로덕션에 올려보면 예상과 다른 청구서가 날아옵니다. 비추론 모드 선택 실수, 도구 호출 비용 누락, 위반 수수료 구조 — 공식 문서를 직접 뜯어보고 나서야 보이는 세 가지 함정을 정리했습니다.
Grok API 모델 라인업과 실제 가격표
결론부터 말씀드리면, 지금 xAI API에서 선택 가능한 모델은 크게 세 세대입니다. Grok 4 계열(Grok 4, Grok 4.1 Fast, Grok 4 Fast), Grok 3 계열(Grok 3, Grok 3 Mini), 그리고 2026년 3월 현재 공개 베타 중인 Grok 4.20입니다. xAI 공식 페이지(x.ai/api)와 공식 문서(docs.x.ai/developers/models) 기준으로 가격을 정리하면 다음과 같습니다.
| 모델 | 입력 /1M | 출력 /1M | 컨텍스트 |
|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | 2M |
| Grok 4 Fast | $0.20 | $0.50 | 2M |
| Grok 4 | $3.00 | $15.00 | 256K |
| Grok 4.20 | $2.00 | $6.00 | 공개 베타 |
| Grok 3 | $3.00 | $15.00 | 131K |
| Grok 3 Mini | $0.30 | $0.50 | 131K |
(출처: xAI 공식 모델 문서, 2026.03 기준)
토큰 단가만 놓고 보면 Grok 4.1 Fast는 현재 시장에서 가장 저렴한 프런티어급 모델 중 하나입니다. 그런데 가격표 뒤에 붙는 조건들이 실제 청구서를 바꿉니다. 다음 섹션에서 하나씩 짚겠습니다.
비추론 모드를 고르면 생기는 일
💡 공식 벤치마크 수치와 실제 모델 목록을 나란히 놓고 보니 이런 차이가 보였습니다 — 같은 가격인데 추론 여부에 따라 품질 점수가 두 배 가까이 벌어집니다.
Grok 4.1 Fast와 Grok 4 Fast는 추론(reasoning) 버전과 비추론(non-reasoning) 버전으로 나뉩니다. 가격은 둘 다 입력 $0.20, 출력 $0.50으로 완전히 동일합니다. 그런데 CostGoat 벤치마크 기준으로 추론 버전은 품질 점수 64인 반면, 비추론 버전은 38에 그칩니다.
⚠️ 같은 가격, 다른 품질
grok-4-1-fast-reasoning → 품질 점수 64
grok-4-1-fast-non-reasoning → 품질 점수 38
두 모델의 토큰 단가는 $0.20/$0.50로 동일합니다.
비추론 버전은 단순 분류·정보 추출 같은 고처리량 작업용입니다. 복잡한 에이전트 워크플로우나 코딩·리서치 태스크에 비추론 버전을 그대로 붙이면 품질이 반 토막이 나는데, 청구서는 같은 금액이 나옵니다. xAI 공식 릴리스노트(x.ai/news/grok-4-1-fast)에도 두 변형 모델의 차이가 명시돼 있지만, 한국어 자료 어디에도 이 부분을 짚은 글이 없었습니다.
참고로 Grok 4는 추론이 항상 켜져 있고 `reasoning_effort` 파라미터가 없습니다. Grok 3에서 Grok 4로 마이그레이션할 때 `reasoning_effort`를 그대로 넘기면 API가 에러를 반환합니다. (출처: docs.x.ai/developers/models)
도구 호출 요금 — 토큰 청구서와 별도로 날아옵니다
Grok API의 가장 큰 차별점 중 하나가 Agent Tools API입니다. 웹 검색, X 검색, 코드 실행, 파일 검색을 서버 측에서 직접 처리해줘서 별도 인프라 없이 에이전트를 구성할 수 있습니다. 그런데 이 도구들은 토큰 요금과 무관하게 호출 건수 기준으로 별도 청구됩니다.
| 도구 | 요금 /1,000회 |
|---|---|
| 웹 검색 (web_search) | $5.00 |
| X 검색 (x_search) | $5.00 |
| 코드 실행 (code_execution) | $5.00 |
| 파일 첨부 검색 (attachment_search) | $10.00 |
| 컬렉션 검색 (collections_search) | $2.50 |
| 이미지·영상 분석 | 토큰 기반 |
(출처: xAI 공식 모델·가격 문서, 2026.03 기준)
💡 “토큰 요금이 싸니까 에이전트 비용도 싸겠지”라고 생각하기 쉽습니다. 그런데 실제 리서치 에이전트 벤치마크(x.ai 공식 발표)를 보면, Grok 4.1 Fast + Agent Tools API 조합의 FRAMES 벤치마크 평균 쿼리 비용은 $0.048입니다. 이 중 도구 호출 비용이 상당 부분을 차지합니다.
웹 리서치 쿼리 하나에 에이전트가 자율적으로 3~5회 도구를 호출하면, 도구 요금만 $0.015~$0.025가 붙습니다. (출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.05) 토큰 단가가 아무리 저렴해도 도구 호출이 많은 워크플로우에서는 총 비용이 빠르게 불어납니다.
직접 계산해보면 이렇습니다. 하루 1,000건 리서치 쿼리, 쿼리당 평균 3회 웹 검색 발생 시 — 도구 호출 요금만 월 $450 추가됩니다. $$\text{도구 비용} = 1{,}000 \times 30 \times 3 \times \frac{\$5}{1{,}000} = \$450/\text{월}$$
위반 수수료 구조, 퍼블릭 챗봇에서 왜 문제가 되나
💡 xAI 공식 문서에 명시된 항목인데, 기존에 Grok API를 소개하는 글 어디에도 이 요금이 언급되지 않았습니다 — 도입 전에 반드시 확인해야 할 부분입니다.
xAI는 Usage Guidelines 위반으로 판단된 요청에 대해 응답이 생성되지 않아도 요청당 $0.05를 청구합니다. (출처: docs.x.ai/developers/models — Usage Guidelines Violation Fee 항목, 2026.03) 퍼블릭 서비스에서 불특정 다수 사용자가 들어오면 어느 요청이 위반으로 잡힐지 예측하기 어렵습니다.
실제로 Reddit(r/learnmachinelearning, 2026.02.22)에서 한 개발자가 퍼블릭 챗봇을 운영하다 수 주 만에 예상치 못한 청구서를 받았다고 밝혔습니다. 시스템 프롬프트로 해결이 안 되고, OpenAI Moderation API나 Llama Guard 같은 외부 모더레이션을 앞단에 붙여야 했다는 후기입니다. 단가가 싸다고 선택했는데 외부 모더레이션 API 비용까지 더해진 셈입니다.
Responses API에서는 생성 전에 위반이 감지되면 $0.05 고정 요금이, 생성 중에 위반이 잡히면 생성된 토큰 요금이 그대로 청구됩니다. 두 경우가 다르게 적용된다는 점도 공식 문서에 적혀 있습니다.
경쟁사 비교 — 정말 싼 게 맞는지 직접 계산해봤습니다
mem0.ai가 검증한 2026년 2월 23일 기준 주요 프런티어 모델 가격표를 기반으로 직접 비교합니다.
| 모델 | 입력 /1M | 출력 /1M | 컨텍스트 |
|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | 2M |
| GPT-5 mini | $0.25 | $2.00 | 400K |
| Gemini 3 Flash | $0.50 | $3.00 | 1,048K |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K |
| GPT-5.2 | $1.75 | $14.00 | 400K |
| Gemini 3.1 Pro | $2.00 | $12.00 | 1,048K |
| Grok 4 | $3.00 | $15.00 | 256K |
(출처: mem0.ai/blog/xai-grok-api-pricing, 2026.02.23 기준)
입력 토큰 기준으로는 Grok 4.1 Fast($0.20)가 GPT-5 mini($0.25)보다 20%, Gemini 3 Flash($0.50)보다 60% 저렴합니다. 출력 토큰에서는 차이가 더 커집니다. GPT-5 mini 출력이 $2.00인 반면 Grok 4.1 Fast는 $0.50으로, 출력 비중이 높은 워크플로우에서는 4배 차이가 납니다.
💡 컨텍스트 2M 토큰은 지금 시장에서 프런티어 모델 중 가장 큰 수치입니다. 긴 코드베이스나 장문 문서 분석에서 컨텍스트 초과 비용이 없다는 점은 토큰 단가와 별개로 실질적인 이점입니다.
단, 에코시스템 성숙도는 다릅니다. Grok Enterprise는 2026년 1월에야 정식 출시됐고(출처: x.ai/grok/business), OpenAI·Anthropic 대비 써드파티 통합 지원 범위가 좁습니다. 가격 외 요소로 생태계 깊이가 필요한 프로젝트라면 이 부분을 먼저 확인해야 합니다.
비용을 실제로 줄이는 방법 세 가지
💡 공식 가격표에 나오지 않는 할인 구조들이 있습니다. xAI 문서에 흩어진 항목을 한데 모아봤습니다.
1배치 API — 토큰 비용 50% 절감
실시간 응답이 필요 없는 작업(임베딩 생성, 대량 평가, 데이터 처리)은 Batch API를 쓰면 모든 토큰 유형에 50% 할인이 적용됩니다. 통상 24시간 내 처리됩니다. (출처: docs.x.ai/developers/models — Batch API Pricing 항목)
2자동 프롬프트 캐싱 — 별도 설정 불필요
동일한 프롬프트를 반복 전송하면 캐시 토큰 요금이 자동 적용됩니다. Grok 4.1 Fast 기준 캐시 입력 토큰은 $0.05/1M으로, 비캐시 가격($0.20)의 4분의 1입니다. 시스템 프롬프트와 예시 문장 같은 정적 콘텐츠를 앞부분에 몰아넣으면 캐시 히트율이 높아집니다. (출처: docs.x.ai/developers/models — Cached prompt tokens 항목)
3Grok 3 대신 Grok 3 Mini — 품질은 오히려 높고 비용은 90% 낮습니다
써야 할 상황이 생기면 Grok 3보다 Grok 3 Mini가 낫습니다. CostGoat 벤치마크 기준 Grok 3 Mini 품질 점수는 57, Grok 3는 49입니다. 가격은 Grok 3 Mini 입력 $0.30 vs Grok 3 $3.00으로 10배 차이입니다. 더 싸면서 벤치마크 성능이 높은 모델이 있는데 Grok 3를 쓸 이유가 없습니다.
마지막으로, console.x.ai에서 일별·월별 지출 한도를 설정해두는 게 좋습니다. 기본값은 $0로 크레딧 소진 시 API 접근이 끊기는 구조인데, 한도를 설정하면 월말 청구 방식으로 전환됩니다. 어느 쪽이든 트래픽 스파이크 시 갑작스러운 과금을 막는 안전장치를 먼저 세팅해두는 게 맞습니다.
Q&A
마치며
Grok 4.1 Fast의 토큰 단가는 지금 시장에서 프런티어 모델 중 가장 낮은 축에 속합니다. 2M 토큰 컨텍스트 윈도우도 실질적인 이점입니다. 그런데 비추론 모드의 품질 급락, 도구 호출 별도 청구 구조, 위반 수수료 이 세 가지를 모르고 들어가면 “싸다”는 인상과 다른 청구서를 받게 됩니다.
솔직히 말하면, 단순 텍스트 생성이나 장문 문서 처리 용도라면 Grok 4.1 Fast(reasoning)는 지금 돈 대비 가장 합리적인 선택지 중 하나입니다. 반면 퍼블릭 챗봇이나 에이전트 파이프라인을 엮는 경우라면 숨은 비용 구조를 먼저 설계에 반영해야 합니다.
xAI API 가격은 자주 업데이트됩니다. 아키텍처 결정 전에 반드시 xAI 공식 모델 문서에서 최신 수치를 직접 확인하시기 바랍니다.
본 포스팅 참고 자료
- xAI 공식 모델·가격 문서 — https://docs.x.ai/developers/models
- xAI Grok 4.1 Fast 공식 릴리스노트 — https://x.ai/news/grok-4-1-fast
- xAI API 공식 페이지 — https://x.ai/api
- mem0.ai — xAI Grok API Pricing: Models, Costs & Comparisons (2026.03.05) — https://mem0.ai/blog/xai-grok-api-pricing
- CostGoat Grok API Cost Calculator (2026.02) — https://costgoat.com/pricing/grok-api
본 포스팅은 작성 시점(2026.03.22) 기준 xAI 공식 문서와 공개된 자료를 바탕으로 작성됐습니다. xAI의 서비스 정책·UI·가격·기능은 업데이트로 언제든 변경될 수 있습니다. 아키텍처·도입 결정 전에 반드시 공식 문서에서 최신 정보를 확인하세요.

댓글 남기기