2026.03.25 기준
xAI API 공식 문서 반영
Grok 4.1 Fast 기준

Grok API 요금, 싸다고 믿으면 이게 터집니다

Grok 4.1 Fast는 입력 토큰 100만 개당 $0.20. GPT-5 mini($0.25), Claude Haiku 4.5($1.00)보다 싸서 눈이 가는 건 당연합니다. 근데 막상 써보면 요금 고지서가 예상과 다르게 나오는 경우가 있어요. 공식 문서를 직접 뒤져보니, 토큰 요금 말고도 챙겨봐야 할 항목이 세 가지 더 있었습니다.

$0.20

Grok 4.1 Fast 입력/1M

$5.00

웹 검색 툴/1K 호출

$0.05

필터 위반 건당 청구

Grok API 요금 구조 한눈에 보기

결론부터 말씀드리면, xAI의 Grok API는 현재 두 세대가 공존합니다. Grok 3 계열과 Grok 4 계열인데, 요금 표를 보면 뭔가 이상합니다. 구형인 Grok 3가 신형인 Grok 4와 같은 가격이에요.

모델	입력 /1M	출력 /1M	컨텍스트	추론
Grok 4.1 Fast	$0.20	$0.50	2M	양쪽 가능
Grok 4	$3.00	$15.00	256K	항상 ON
Grok 3	$3.00	$15.00	131K	없음
Grok 3 Mini	$0.30	$0.50	131K	추론 가능
Grok Code Fast	$0.20	$1.50	256K	–

(출처: xAI 공식 API 문서 docs.x.ai/developers/models, 2026.03.25 기준)

표를 보면 Grok 3는 Grok 4보다 컨텍스트가 절반에 불과한데 같은 요금을 받습니다. xAI 입장에서 Grok 3는 이제 ‘유지 모드’이고, 신규 프로젝트에 쓸 이유가 거의 없어요.

▲ 목차로 돌아가기

Grok 3 Mini가 Grok 3보다 나은 이상한 이유

💡 공식 요금표와 실제 벤치마크를 같이 놓고 보니 이런 차이가 보였습니다 — 더 싼 모델이 더 비싼 모델을 이기는 경우가 Grok 3 계열에서 실제로 발생합니다.

써보니까 제일 의아했던 부분이 이겁니다. Grok 3 Mini는 Grok 3보다 입력 요금이 90% 저렴합니다($0.30 vs $3.00). 그런데 Artificial Analysis가 집계한 인텔리전스 인덱스에서 Grok 3 Mini(추론 high 모드)가 Grok 3 논추론 모드보다 점수가 더 높아요.

xAI가 공식 발표 자료에서 밝힌 수치에서도 Grok 3 Mini는 AIME 2024 수학 벤치마크에서 93%를 기록했습니다. (출처: xAI 공식 Grok 3 Mini 발표, 2025.04) 반면 Grok 3는 추론 기능 자체가 없습니다. 즉, 수학·코딩·논리 추론이 필요한 작업에서는 Grok 3 Mini가 Grok 3보다 실질적으로 앞섭니다.

💰 직접 계산해보면

월 1,000만 입력 토큰 / 300만 출력 토큰 기준:
Grok 3: $10/M × 10 + $15/M × 3 = $75.00
Grok 3 Mini: $0.30/M × 10 + $0.50/M × 3 = $4.50
→ 같은 작업에 Grok 3 쓰면 16.7배를 더 냅니다.

Grok 3를 지금 쓰고 있다면 한 번 점검해볼 필요가 있습니다. 이유는 공개된 바 없지만, xAI가 Grok 3의 가격을 내리지 않고 있어요.

▲ 목차로 돌아가기

툴 호출 요금, 계산하면 이렇게 나옵니다

토큰 요금만 보고 “Grok 4.1 Fast 저렴하다”고 생각했다가 청구서 보고 당황하는 경우가 생깁니다. xAI는 웹 검색·코드 실행·파일 검색 같은 서버 사이드 툴을 1,000회 호출당 별도 요금으로 청구합니다. (출처: docs.x.ai/developers/models, 2026.03.25 기준)

툴	1K 호출 요금	호출당 단가
웹 검색 (web_search)	$5.00	$0.005
X 검색 (x_search)	$5.00	$0.005
코드 실행 (code_execution)	$5.00	$0.005
파일 첨부 검색	$10.00	$0.010
컬렉션 검색 (RAG)	$2.50	$0.0025
이미지/영상 분석, Remote MCP	토큰 기반	–

에이전트가 쿼리 하나당 웹 검색을 3~5회 자동으로 호출하면, 요청 1개에 $0.015~$0.025의 툴 비용이 추가됩니다. 1만 건 처리 시 툴 비용만 $150~$250이 더 붙습니다. 토큰 요금이 아무리 싸도 아무 의미가 없어요.

막상 해보면 다릅니다 — 에이전트 설계 단계에서 “이 쿼리가 정말 실시간 검색이 필요한가?”를 먼저 따지는 게 요금 관리의 핵심입니다.

▲ 목차로 돌아가기

필터에 걸리면 응답도 없는데 돈은 나갑니다

💡 다른 AI API 제공사에서는 콘텐츠 필터에 걸리면 요금을 안 내는 게 일반적입니다 — Grok은 다릅니다.

xAI 공식 문서에 딱 이렇게 나와 있습니다: “For violations that are caught before generation in the Responses API, we will charge a $0.05 usage guideline violation fee per request.” (출처: docs.x.ai/developers/models, 2026.03.25 기준)

응답을 생성하기 전에 필터로 막혀도 건당 $0.05가 청구됩니다. 테스트 중에 “왜 이렇게 요금이 많이 나오지?” 싶은 상황이 생기면 이 항목을 먼저 확인해야 합니다.

⚠️ 실제 사례 (Reddit r/grok, 2026.03.21)

사용자 monsieurpooh는 Grok 4.1 Fast 비추론 모드를 쓰다가 1시간에 $15, 1분에 $3가 청구된 것을 확인. 원인은 콘텐츠 필터 위반 시 자동 청구되는 $0.05/건이었음. 추론 모드에서는 같은 상황에서 필터가 다르게 작동해 이 요금이 발생하지 않았다고 밝혔습니다. xAI가 공식 답변을 내놓지 않은 부분입니다.

이 부분이 좀 아쉬웠습니다. 입력 프롬프트에 문제가 없다고 생각해도, 필터 판단 기준이 모드별로 다르게 적용되는 것으로 보입니다. 프로덕션에 올리기 전에 비추론 모드를 쓴다면 반드시 console.x.ai에서 지출 한도를 먼저 설정하세요.

▲ 목차로 돌아가기

경쟁사 대비 Grok이 실제로 유리한 조건

단점만 있는 건 아닙니다. Grok 4.1 Fast가 진짜 강점을 발휘하는 조건이 있습니다. 2026년 3월 기준 경쟁사 경량 모델과 비교하면 이렇습니다. (출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.05)

모델	입력 /1M	출력 /1M	컨텍스트
Grok 4.1 Fast	$0.20	$0.50	2M
GPT-5 mini	$0.25	$2.00	400K
Claude Haiku 4.5	$1.00	$5.00	200K
Gemini 3 Flash	$0.50	$3.00	1M

출력 토큰에서 차이가 극명합니다. GPT-5 mini 출력이 $2.00인데 Grok 4.1 Fast는 $0.50입니다. 긴 응답을 많이 생성하는 워크플로우라면 이 차이가 쌓입니다.

컨텍스트 2M 토큰도 실질적인 차별점입니다. 200,000자짜리 계약서 파일을 통째로 넣고 한 번에 분석할 수 있는 모델은 현재 Grok 4.1 Fast 외에 선택지가 없습니다. 청킹 없이 처리하면 문맥 손실이 줄고 코드가 간결해집니다.

단, 툴 요금과 필터 요금을 합산한 실효 단가를 계산해야 합니다. 토큰 단가만 보고 “가장 싸다”고 단정하면 안 됩니다.

▲ 목차로 돌아가기

요금 아끼는 방법, 공식 문서에 나온 것만 추렸습니다

xAI 공식 문서(docs.x.ai/developers/models)에 명시된 절감 방법을 직접 확인했습니다. 여러 블로그에서 “이렇게 하면 좋다”는 수준이 아니라, 실제로 요금에 반영되는 항목입니다.

1
배치 API 사용 — 50% 할인

실시간 응답이 필요 없는 작업은 배치 API로 처리하면 토큰 요금이 절반으로 줄어듭니다. 요청이 24시간 내 처리되며, 처리 건수가 표준 레이트 리밋에도 카운트되지 않습니다. (출처: docs.x.ai/developers/models)

2
프롬프트 캐싱 — 자동 적용, 최대 75% 절감

동일한 프롬프트 앞부분을 반복 사용하면 캐시 토큰 요금이 적용됩니다. Grok 4.1 Fast 기준 캐시 입력은 $0.05/M(표준의 25%). 시스템 프롬프트를 앞에 고정하고 동적 내용을 뒤에 붙이면 캐시 히트율이 높아집니다.

3
지출 한도 설정 — 필수

console.x.ai에서 월 지출 한도를 설정해야 합니다. 기본값은 $0로 크레딧 소진 시 중단이지만, 월 청구 방식으로 전환하면 예상치 못한 과금이 발생할 수 있습니다. 특히 비추론 모드 사용 시 필터 위반 요금이 누적될 수 있으니 초기에 낮은 한도부터 설정하는 것이 안전합니다.

4
데이터 공유 프로그램 — 월 $150 추가 크레딧

Settings > Data Sharing에서 API 입력 공유를 켜면 월 $150 크레딧이 추가됩니다. 신규 가입 첫 달 $25 포함해 최대 $175를 테스트에 쓸 수 있습니다. 다만 민감한 비즈니스 데이터나 개인정보가 포함된 요청에는 비활성화가 원칙입니다.

▲ 목차로 돌아가기

Q&A

Q. Grok API를 쓰려면 X 프리미엄 구독이 필요한가요?

아닙니다. xAI 계정만 있으면 됩니다. console.x.ai에서 가입 후 API 키를 생성하면 바로 사용 가능합니다. X 프리미엄 구독은 챗봇 인터페이스용이고, API 접근과는 별개입니다.

Q. Grok 4.1 Fast와 Grok 4.1 Fast 비추론 모드는 요금이 같은가요?

토큰 단가는 동일합니다($0.20/$0.50 /1M). 단, 추론 모드는 내부적으로 추론 토큰이 추가로 소비돼 실제 청구 토큰이 더 많을 수 있습니다. 반면 비추론 모드는 콘텐츠 필터 위반 시 $0.05 요금이 더 자주 발생할 수 있습니다. (xAI 공식 문서 기준, 정확한 필터 작동 차이는 공개되지 않음)

Q. 웹 검색 툴을 안 쓰면 툴 요금이 아예 안 나오나요?

맞습니다. 툴 요금은 실제로 툴이 호출될 때만 청구됩니다. 에이전트가 자율적으로 툴을 결정하는 구조라면 프롬프트에서 “학습 데이터로만 답하고 검색은 사용자가 명시적으로 요청할 때만 써라”는 식으로 제한하면 불필요한 툴 호출을 줄일 수 있습니다.

Q. Grok 3를 지금 새 프로젝트에 쓰는 게 맞나요?

생각보다 간단합니다 — 쓸 이유가 없습니다. Grok 4.1 Fast가 Grok 3보다 컨텍스트는 15배 크고(2M vs 131K), 가격은 같거나 더 쌉니다. Grok 3는 xAI가 유지 모드로만 운영 중이며 공식 문서에서도 “legacy” 모델로 분류합니다.

Q. 배치 API와 일반 API의 결과물 품질이 다른가요?

xAI 공식 문서에서 별도 이유를 밝히지 않았습니다. 같은 모델을 쓰므로 품질 차이가 없을 가능성이 높지만, 처리 시간이 최대 24시간이라는 점만 감수하면 됩니다. 비실시간 데이터 처리, 임베딩 생성, 대량 평가 워크플로우에서 50% 할인 효과가 큽니다.

▲ 목차로 돌아가기

마치며

Grok 4.1 Fast의 토큰 단가는 현재 주요 경량 모델 중 가장 낮은 수준입니다. 특히 2M 컨텍스트와 출력 토큰 $0.50이라는 조합은 장문 처리 워크플로우에서 실질적인 이점을 줍니다.

다만 기대했던 것과 달랐습니다 — 툴 요금과 콘텐츠 필터 위반 요금이라는 숨겨진 변수가 있고, 특히 비추론 모드에서의 과금 이슈는 지금도 명확한 설명이 없습니다. 프로덕션 투입 전에 console.x.ai에서 지출 한도를 먼저 설정하고, 소규모 트래픽으로 비용 패턴을 먼저 관찰하는 것이 안전합니다.

Grok 3는 지금 당장 레거시로 취급해도 무방합니다. 같은 요금에 더 낮은 성능과 좁은 컨텍스트를 선택할 이유가 없으니까요.

📎 본 포스팅 참고 자료

xAI 공식 API 문서 — Models and Pricing: docs.x.ai/developers/models
xAI 공식 API 소개: x.ai/api
Mem0 — xAI Grok API Pricing: Models, Costs & Comparisons (2026.03.05): mem0.ai/blog/xai-grok-api-pricing
The Decoder — Grok 3 Mini benchmark analysis (2025.04.20): the-decoder.com
CostGoat — Grok API Cost Calculator (2026.02.01): costgoat.com/pricing/grok-api

※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. xAI는 모델 요금과 툴 정책을 수시로 업데이트하므로, 프로덕션 적용 전 반드시 공식 문서에서 최신 요금을 재확인하시기 바랍니다. 본 포스팅은 2026년 3월 25일 기준으로 작성되었습니다.

Grok API 요금, 싸다고 믿으면 이게 터집니다

Grok API 요금 구조 한눈에 보기

Grok 3 Mini가 Grok 3보다 나은 이상한 이유

툴 호출 요금, 계산하면 이렇게 나옵니다

필터에 걸리면 응답도 없는데 돈은 나갑니다

경쟁사 대비 Grok이 실제로 유리한 조건

요금 아끼는 방법, 공식 문서에 나온 것만 추렸습니다

Q&A

마치며

📎 본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

Grok API 요금, 싸다고 믿으면 이게 터집니다

Grok API 요금, 싸다고 믿으면 이게 터집니다

Grok API 요금 구조 한눈에 보기

Grok 3 Mini가 Grok 3보다 나은 이상한 이유

툴 호출 요금, 계산하면 이렇게 나옵니다

필터에 걸리면 응답도 없는데 돈은 나갑니다

경쟁사 대비 Grok이 실제로 유리한 조건

요금 아끼는 방법, 공식 문서에 나온 것만 추렸습니다

Q&A

마치며

📎 본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기