Grok 3 API 요금제, 싸다는 말이 전부가 아닌 이유

Published on

in

Grok 3 API 요금제, 싸다는 말이 전부가 아닌 이유

2026.03.26 기준
xAI 공식 문서 기준
Grok 3 / Grok 4 계열

Grok 3 API 요금제,
싸다는 말이 전부가 아닌 이유

입력 토큰 $3/M, 출력 토큰 $15/M — 수치만 보면 Claude Sonnet 4.6과 동일합니다. 그런데 실제 청구서는 생각과 다르게 나옵니다. 툴 호출 비용, 위반 페널티, 그리고 이미 Grok 3보다 저렴한 다음 세대 모델이 존재한다는 것까지. 공식 문서에서 직접 확인한 내용을 정리했습니다.

$3.00
입력 토큰/M
$15.00
출력 토큰/M
131K
컨텍스트 윈도우

Grok 3 API란 무엇이고, 지금도 쓸 만한가

Grok 3 API는 일론 머스크의 xAI가 2025년 2월에 출시한 플래그십 언어 모델 Grok 3을 API 형태로 제공하는 서비스입니다. OpenAI와 Anthropic SDK와 호환되는 구조로 설계돼 있어서, API 키 하나 바꾸고 엔드포인트 URL만 교체하면 바로 붙일 수 있다는 게 가장 큰 장점이었습니다. (출처: xAI 공식 API 페이지, x.ai/api)

xAI 자체 벤치마크 기준, Grok 3는 AIME 2025에서 93.3%(Think 모드), GPQA Diamond에서 84.6%를 기록했습니다. 이건 2025년 초 기준으로 GPT-4o, Claude 3.5 Sonnet과 충분히 경쟁 가능한 수치였습니다. 문제는 지금이 2026년 3월이라는 점입니다.

현재 xAI는 Grok 4, Grok 4.1 Fast, Grok 4.20까지 출시한 상태입니다. Grok 3는 공식 문서에서 “레거시 모델(Legacy model)”로 분류되기 시작했습니다. 쓸 수는 있지만, 더 이상 xAI의 주력 모델이 아닙니다.

▲ 목차로 돌아가기

공식 요금표 — 모델별 토큰 가격 전체 정리

xAI 공식 문서(docs.x.ai/developers/models)에 공개된 현행 모델 가격을 직접 확인했습니다. 2026년 3월 26일 기준입니다.

모델 입력 $/M 출력 $/M 컨텍스트 상태
grok-4.20 $2.00 $2.00 2M 신규
grok-4.1-fast $0.20 $0.50 2M 신규
grok-4 $3.00 $15.00 256K 활성
grok-3-beta $3.00 $15.00 131K 레거시
grok-3-mini-beta $0.30 $0.50 131K 레거시

(출처: xAI 공식 API 페이지 x.ai/api, Mem0 블로그 2026.03.03 기준 수치 교차 검증)

▲ 목차로 돌아가기

Grok 3를 써야 할 이유가 점점 줄어드는 이유

💡 공식 발표 문서와 현재 요금표를 같이 놓고 보니, Grok 3 API를 2026년 3월 시점에 그대로 쓰는 게 경제적으로 맞지 않는다는 게 보였습니다.

Grok 3 API 입력 토큰 가격은 $3.00/M, 출력은 $15.00/M입니다. 그런데 xAI가 새로 출시한 Grok 4.1 Fast는 입력 $0.20/M, 출력 $0.50/M입니다. 토큰당 가격이 입력 기준 15배, 출력 기준 30배 저렴합니다. 게다가 컨텍스트 윈도우는 Grok 3의 131K에서 Grok 4.1 Fast의 2M 토큰으로 15배 이상 늘었습니다. (출처: xAI 공식 API 페이지, x.ai/api)

“Grok 3 API 쓰면 저렴하다”는 얘기가 2025년 초 기준으로는 맞았습니다. 하지만 지금 기준으로는 틀렸습니다. Grok 3는 Claude Sonnet 4.6($3.00/$15.00)과 입출력 단가가 동일한데, 실제로는 지식 기준일이 2024년 11월로 고정돼 있어서 최신 데이터에 접근하려면 웹서치 툴을 켜야 합니다. 그러면 또 툴 비용이 별도로 붙습니다.

xAI 공식 문서에 이렇게 나옵니다. “Grok 3 and Grok 3 Mini are the legacy models, previously the flagship generation. They remain available via the API, but the Grok 4 family is now xAI’s primary focus.” — 레거시 모델로 분류된 시점에서, Grok 3를 굳이 선택해야 할 기술적 이유가 남아 있는지 직접 따져봐야 합니다.

▲ 목차로 돌아가기

툴 호출 비용, 토큰보다 더 무서운 청구서

💡 “Grok은 실시간 웹 검색이 된다”는 말, 맞습니다. 그런데 그게 무료가 아닙니다. 토큰 청구서와는 별도로 나옵니다.

Grok API의 실시간 정보 접근 기능은 서버사이드 툴(Server-side tools)을 통해 작동합니다. 이 툴들은 토큰 사용 요금과 별개로 호출 횟수당 비용이 추가 청구됩니다. xAI 공식 문서에 명시된 툴 호출 단가는 아래와 같습니다.

비용 / 1,000 호출 비고
웹 서치 (web_search) $5.00 인터넷 검색 + 웹페이지 브라우징
X 검색 (x_search) $5.00 X 포스트, 프로필, 스레드 검색
코드 실행 (code_execution) $5.00 샌드박스 Python 실행
파일 첨부 검색 $10.00 메시지 첨부 파일 검색
컬렉션 검색 (RAG) $2.50 업로드된 문서 컬렉션 쿼리

실제로 웹 리서치가 필요한 쿼리 하나를 보내면 Grok 에이전트가 자율적으로 3~5회 웹서치를 호출합니다. 1,000 호출당 $5이므로 1회 호출 = $0.005. 쿼리당 4회 호출이면 $0.02가 툴 비용으로만 붙습니다. 이건 토큰 비용과 완전히 별개입니다. 쿼리가 복잡할수록 호출 횟수가 늘어나기 때문에 사전에 예산을 잡기 어렵습니다.

여기에 더해 xAI 공식 문서에는 Usage Guidelines Violation Fee 조항이 있습니다. 요청이 이용 약관을 위반한다고 시스템이 판단하면 — 실제로 응답이 생성되지 않더라도 — 요청당 $0.05가 청구됩니다. Responses API에서 생성 전 단계에서 걸리는 경우에 해당합니다. (출처: docs.x.ai/developers/models) 이게 개발 중 테스트 요청에서도 적용됩니다.

정리하면, Grok 3 API의 실제 비용 구조는 “토큰 요금 + 툴 호출 요금 + (경우에 따라) 위반 페널티” 세 항목의 합산입니다. 토큰 가격만 보고 예산을 짜면 실제 청구서에 당황할 수 있습니다.

▲ 목차로 돌아가기

실제 비용 줄이는 3가지 방법 — 공식 문서에 다 있습니다

💡 xAI가 공식 문서에 절감 방법을 직접 명시해 뒀는데, 한국어 블로그에서 이걸 짚은 글은 아직 없었습니다.

① Batch API — 토큰 비용 50% 절감

실시간 응답이 필요 없는 작업(대규모 데이터 처리, 임베딩 생성, 평가 배치 등)은 Batch API를 쓰면 됩니다. 입력·출력·캐시·추론 토큰 모든 유형에 표준 요금의 50%가 적용됩니다. 처리 시간은 최대 24시간이지만 비율 제한(Rate limit)도 적용받지 않습니다. Grok 3-beta 기준으로 입력 $1.50/M, 출력 $7.50/M으로 내려갑니다. (출처: docs.x.ai/developers/models)

② 프롬프트 캐싱 — 반복 요청 비용 제거

xAI는 동일한 컨텍스트나 시스템 프롬프트를 반복 전송할 때 캐싱을 자동 적용합니다. Grok 4.1 Fast 기준 캐시 토큰 단가는 $0.05/M으로, 일반 입력 토큰($0.20/M)의 25% 수준입니다. Grok 3-beta의 캐시 단가는 $0.75/M입니다. 캐시 효과를 극대화하려면 시스템 프롬프트·예시·참조 문서 같은 정적 콘텐츠를 앞쪽에 배치하고, 동적 콘텐츠는 뒷부분에 위치시키는 구조로 설계하면 됩니다.

③ 툴 호출 최소화 — 웹서치 자동 트리거 제한

웹서치 툴이 켜진 상태에서 단순 질문을 보내도 에이전트가 자율적으로 검색을 호출할 수 있습니다. 시스템 프롬프트에 “사용자가 명시적으로 검색을 요청하는 경우에만 웹서치 툴을 사용하세요”라는 제한 조건을 추가하면 불필요한 $5/1,000 콜 비용을 막을 수 있습니다. 개발 초기에 spending cap(지출 한도)을 console.x.ai에서 먼저 설정해두는 것도 필수입니다.

▲ 목차로 돌아가기

경쟁 모델과 비교 — 같은 돈에 뭘 더 받나

모델 입력 $/M 출력 $/M 컨텍스트 지식 기준일
Grok 4.1 Fast $0.20 $0.50 2M 2024.11
Grok 3-beta ⚠️ $3.00 $15.00 131K 2024.11
Claude Sonnet 4.6 $3.00 $15.00 200K 2025.08
GPT-5.2 $1.75 $14.00 400K 2025년~
Gemini 3 Flash $0.50 $3.00 1M 2025년~

(출처: Mem0 블로그 2026.03.03 기준 수치, xAI 공식 API 페이지)

같은 $3.00/M 입력 요금에서 Grok 3-beta를 Claude Sonnet 4.6과 비교하면, 컨텍스트 윈도우가 131K 대 200K로 Grok 3가 좁고, 지식 기준일도 2024년 11월로 동일합니다. 즉 같은 가격에 컨텍스트는 더 좁고, 지식은 더 오래된 모델입니다. 특별히 Grok 3를 선택해야 할 이유가 현재 시점에서는 희박합니다.

반면 Grok 4.1 Fast는 입력 $0.20/M에 컨텍스트 2M, 추론·비추론 모드 선택 가능. 대부분의 장문 문서 분석이나 에이전트 워크플로에서 Grok 4.1 Fast가 Grok 3 대비 훨씬 현실적인 선택입니다. xAI 공식 릴리스노트에 따르면 Grok 4 Fast는 Grok 4 대비 추론 토큰 소비가 평균 40% 적으면서 MATH-500, HumanEval 벤치마크에서 유사한 성능을 냈습니다.

▲ 목차로 돌아가기

Q&A

Q1. Grok 3 API와 Grok 4 API 중 지금 당장 시작한다면 어느 쪽을 써야 하나요?
대부분의 경우 Grok 4.1 Fast를 권장합니다. 입력 $0.20/M, 출력 $0.50/M으로 Grok 3-beta($3.00/$15.00)보다 훨씬 저렴하고, 컨텍스트도 2M으로 15배 이상 넓습니다. Grok 3는 이미 레거시 분류를 받았습니다. 복잡한 추론이 필요한 경우라면 Grok 4($3.00/$15.00)를 골라야 하는데, 이 경우에도 Grok 3와 가격은 같지만 성능은 더 높습니다.
Q2. Grok API는 OpenAI SDK와 호환되나요?
네, xAI API는 OpenAI SDK 및 Anthropic SDK와 호환됩니다. API 키를 xAI 키로 교체하고 기본 URL을 xAI 엔드포인트로 변경하면 기존 코드를 그대로 사용할 수 있습니다. 다만, Grok 4 계열 추론 모델에서는 presencePenalty, frequencyPenalty, stop 파라미터가 지원되지 않으니 마이그레이션 시 확인이 필요합니다.
Q3. 웹서치 툴을 켜면 비용이 얼마나 더 나오나요?
웹서치(web_search)는 1,000 호출당 $5, 즉 호출 1회당 $0.005입니다. 에이전트가 자율적으로 결정하기 때문에 쿼리 1개당 3~5회 호출이 발생할 수 있습니다. 그러면 토큰 비용과 별개로 쿼리당 약 $0.015~$0.025가 추가됩니다. 파일 첨부 검색(attachment_search)은 $10/1,000 호출로 두 배 더 비쌉니다.
Q4. SuperGrok 구독($30/월)과 API 요금제 중 어느 쪽이 더 유리한가요?
개인 사용자라면 SuperGrok($30/월)이 편리합니다. API 요금제는 프로그래밍 방식으로 서비스를 만들거나 대량 요청을 처리하는 경우에 적합합니다. 단순히 작문, 리서치, 코딩 도움을 받으려는 개인이라면 SuperGrok으로 시작하는 게 맞고, 실제 프로덕트 개발이라면 API를 써야 합니다. ChatGPT Plus($20/월), Claude Pro($20/월)보다 $10 더 비싼 점은 감안해야 합니다.
Q5. Grok 3 API의 지식 기준일이 2024년 11월이면 2026년 뉴스는 모르나요?
xAI 공식 문서에 이렇게 나옵니다. “Grok has no knowledge of current events or data beyond what was present in its training data.” 즉, 웹서치 툴(web_search 또는 x_search)을 명시적으로 활성화하지 않으면 2024년 11월 이후 사건은 알지 못합니다. 실시간 정보가 필요한 서비스를 만들 계획이라면 웹서치 툴 비용을 반드시 예산에 포함해야 합니다.

▲ 목차로 돌아가기

마치며

Grok 3 API는 2025년 초 기준으로는 유의미한 선택지였습니다. 하지만 2026년 3월 현재, 같은 xAI 플랫폼 안에 Grok 3보다 15배 저렴하고 컨텍스트는 15배 넓은 Grok 4.1 Fast가 존재합니다. “Grok 3 API 요금제가 저렴하다”는 말은, 어떤 모델과 비교하느냐에 따라 완전히 다른 이야기가 됩니다.

솔직히 말하면, 지금 시점에서 Grok 3를 새로 도입할 이유는 거의 없습니다. xAI 생태계에 처음 진입한다면 Grok 4.1 Fast부터 시작하는 게 합리적입니다. 그리고 웹서치 툴을 쓸 계획이라면 반드시 지출 한도를 먼저 설정하고 시작하세요. 툴 호출 비용은 토큰 비용보다 예측하기가 더 어렵습니다.

xAI는 현재 Grok 4.20까지 모델을 계속 출시하고 있습니다. 요금 체계도 빠르게 바뀝니다. 코드를 짜기 전에 반드시 공식 문서를 한 번 더 열어보는 습관이 가장 중요합니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료
  1. xAI 공식 API 페이지 — x.ai/api
  2. xAI 공식 모델·요금 문서 — docs.x.ai/developers/models
  3. Mem0 블로그 xAI Grok API Pricing (2026.03.03 기준) — mem0.ai/blog/xai-grok-api-pricing
  4. Grok 3 vs Claude Sonnet 4.6 비교 — docsbot.ai
  5. pricepertoken.com Grok 3 요금 비교 (2026.03.22 갱신) — pricepertoken.com

본 포스팅은 2026년 3월 26일 기준 xAI 공식 문서 및 공개된 서드파티 요금 비교 자료를 근거로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 정확한 현행 요금은 반드시 xAI 공식 문서(docs.x.ai)에서 직접 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기