Grok 4.20 Multi-Agent Beta
Grok 4.20, $30 내면 뭐가 달라지나요?
xAI가 2026년 2월 17일 공개 베타를 시작하고, 3월 9일 공식 발표를 마친 Grok 4.20은 단순한 버전 업이 아닙니다. 내부 구조 자체가 바뀌었어요. 하나의 모델이 답하는 대신 4개의 에이전트가 병렬로 돌아가며 서로 반박하고 검증한 뒤 최종 답을 냅니다. 근데 이 멀티에이전트 구조, 당연히 4배 비쌀 것 같죠? 그게 아닙니다.
4개 에이전트가 하나처럼 보이는 이유
Grok 4.20에 질문을 입력하면 답변이 하나만 나옵니다. 그런데 내부에서는 4개 에이전트가 동시에 돌아갑니다. Grok(대장), Harper(리서처), Benjamin(분석가), Lucas(반박 전담)가 각자 독립적으로 답을 만들고, 서로 반박한 뒤, Grok이 최종 합성을 맡습니다. 사용자 눈에는 절차가 보이지 않아요. 일부 사용자들이 UI에서 잠깐 내부 토론이 보였다고 보고하기도 했지만, 일반적으로는 최종 답만 노출됩니다. (출처: aimaker.substack.com, 2026.03.24)
xAI는 이걸 “adversarial consensus(적대적 합의)”라고 부릅니다. 기존 AI처럼 한 모델이 자기 답을 스스로 검증하는 방식이 아니라, 다른 에이전트가 틀린 부분을 잡아내는 구조입니다. Grok 4.1에서 약 12%였던 환각률이 Grok 4.20에서 약 4.2%로 떨어진 게 이 설계 덕분입니다. 65% 감소, 절대 수치로는 12%→4.2%입니다.
MIT 연구진이 같은 모델 인스턴스 여러 개를 서로 토론시켰을 때 산술 정확도가 단일 에이전트 약 70%에서 3개 에이전트 2라운드 기준 약 95%로 높아진다는 결과를 발표한 적 있습니다. (MIT News, 2023) Grok 4.20의 구조가 이 원리를 제품으로 구현한 첫 사례입니다.
4배 비쌀 것 같지만 실제 추가 비용은 1.5~2.5배입니다
💡 공식 발표문과 API 스펙 문서를 같이 놓고 보니 이런 차이가 보였습니다 — 에이전트 4개를 돌리는데 왜 요금이 4배가 아닌지, 실제 추론 비용 구조를 공식 수치로 직접 확인했습니다.
에이전트가 4개면 연산도 4배, 비용도 4배 — 이게 직관적인 계산입니다. 실제로는 다릅니다. 4개 에이전트가 같은 모델 가중치를 공유하고, 동일한 입력 컨텍스트 prefix를 캐시로 공유해서 추가 비용이 단일 패스 대비 1.5~2.5배 수준에 그칩니다. (출처: aimaker.substack.com, 2026.03.24) 4개가 병렬로 돌지만, 4배 연산이 아닙니다.
API 요금표를 보면 이 논리가 숫자로 확인됩니다. Grok 4.20 Multi-Agent Beta API 요금은 입력 $2/100만 토큰, 출력 $6/100만 토큰입니다. (출처: developer.puter.com, API 릴리스 날짜 2026.03.12) 단일 모델 Grok 4.1 Fast 대비 약 1.5배 높은 수준이에요. 4배가 아닙니다.
계산을 직접 해보면: 입력 1만 토큰 + 출력 2,000 토큰짜리 쿼리 하나를 Grok 4.20 Multi-Agent API로 처리할 경우 비용은 $0.02 + $0.012 = 약 $0.032. 같은 작업을 단일 Grok 4.1 기준으로 추산하면 약 $0.02 내외. 즉 쿼리당 차이는 $0.01~$0.015 수준입니다.
무료로는 Grok 4.20을 쓸 수 없습니다
Grok은 X(트위터) 앱에서 무료로 쓸 수 있다고 알려져 있습니다. 맞습니다. 단, 접근 가능한 모델이 다릅니다. 무료 사용자는 2시간마다 10개 프롬프트, Grok 4.1 이하 모델까지만 사용 가능합니다. (출처: getaiperks.com, 2026.03.24) Grok 4.20은 모델 메뉴에서 수동으로 “Grok 4.2″를 선택해야 하고, SuperGrok($30/월) 또는 X Premium+ 구독이 없으면 선택지 자체가 안 뜹니다.
정리하면 무료 계정으로 Grok 앱을 열었을 때 보이는 게 Grok 4.20이 아닐 가능성이 높습니다. Auto 모드에서 복잡한 쿼리를 Grok 4로 라우팅해주는 기능이 일부 무료 사용자에게도 열려 있다는 xAI 공식 X 게시글도 있긴 합니다만, Grok 4.20 멀티에이전트 구조는 다릅니다. SuperGrok 구독 이상에서만 안정적으로 접근됩니다.
Grok 이미지 생성 기능도 같은 구조입니다. 2026년 3월 20일 Reddit r/grok 커뮤니티에는 무료 이미지 생성 시도 횟수가 5~35회 수준으로 급감했다는 글이 올라왔습니다. (reddit.com/r/grok, 2026.03.20) Grok의 무료 제공 범위는 생각보다 조용히, 빠르게 좁아지고 있습니다.
매주 조용히 업데이트되는 모델, 구독자는 몰랐습니다
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — Rapid Learning Architecture라는 개념이 구독 기간 중 모델이 교체된다는 뜻임을 아는 사람이 많지 않았습니다.
Grok 4.20에는 “Rapid Learning Architecture”라는 구조가 적용됩니다. 배포 후 고정된 모델이 아니라, 실사용 피드백을 반영해 매주 능력치가 갱신됩니다. (출처: basenor.com, 2026.03.09) 오늘 쓴 Grok 4.20과 한 달 뒤 쓰는 Grok 4.20이 버전 번호는 같아도 내부적으로 다른 모델입니다.
다른 주요 AI 서비스는 이렇지 않습니다. Claude, GPT, Gemini는 버전이 바뀌면 공식 발표를 합니다. Grok 4.20은 같은 이름 아래 조용히 업데이트됩니다. 이 말은 동일한 프롬프트에 대한 답이 다음 달에 달라질 수 있다는 뜻이고, 재현 가능성을 요구하는 연구나 반복 작업에는 구조적으로 맞지 않을 수 있습니다.
Tesla의 FSD(자율주행) 소프트웨어가 수백만 대 차량의 주행 데이터를 OTA로 반영해 개선되는 것과 같은 철학입니다. xAI와 Tesla는 최고경영자가 같고, 이 “사용 → 학습 → 자동 개선” 루프 설계가 두 제품에 모두 적용됩니다. Grok 4.20의 주간 업데이트는 우연한 설계가 아니라, 이 회사의 핵심 전략입니다.
에이전트 이름에 역할이 있습니다 — Lucas가 핵심입니다
Grok 4.20의 4개 에이전트는 같은 가중치를 쓰지만 역할이 다른 시스템 프롬프트로 작동합니다. 역할이 어떻게 나뉘는지 공식 자료에 나와 있습니다. (출처: aimaker.substack.com, 2026.03.24)
| 에이전트 | 역할 | 핵심 기능 |
|---|---|---|
| Grok (Captain) | 조율·합성 | 질문을 세분화하고 최종 답 작성 |
| Harper | 실시간 리서치 | 웹·X 파이어호스(약 6,800만 트윗/일) 검색 |
| Benjamin | 수치·코드 분석 | 계산·코드·논리 검증 담당 |
| Lucas | 반박 전담 | 나머지 에이전트 주장 전부 의심·재검토 |
Lucas의 역할이 가장 중요합니다. “이 팀에서 반박하는 사람의 역할이 나머지를 합친 것보다 더 많은 실수를 막는다”는 원리가 시스템에 내장된 셈입니다. 자기 의심을 잘 못하는 단일 모델의 한계를 구조로 해결한 것입니다.
Harper가 X 파이어호스 데이터를 실시간으로 끌어온다는 점도 차별화 포인트입니다. 하루 6,800만 건 이상의 영어 트윗을 처리해서 훈련 컷오프 이후의 최신 정보를 실시간으로 보완합니다. 트레이딩 대회 Alpha Arena Season 1.5에서 Grok 4.20 변형 4개가 상위 6위 중 4자리를 차지하고 $1만을 $1만 1천~1만 3,500으로 불린 것도 이 실시간 X 데이터 구조 덕분으로 분석됩니다. (출처: nextbigfuture.com, 2026.02.17)
$30 SuperGrok과 $300 Heavy, 차이가 숫자만큼인가요?
요금 체계가 여러 겹입니다. 직접 정리해봤습니다.
| 플랜 | 월 요금 | 에이전트 수 | 주요 대상 |
|---|---|---|---|
| 무료 (X 기본) | $0 | Grok 4.1 이하 | 가벼운 체험 |
| SuperGrok | $30 | 기본 4개 | 일반 사용자·업무 |
| SuperGrok Heavy | $300 | 최대 16개 | 연구·엔터프라이즈 |
| API (Multi-Agent Beta) | 사용량 기반 | API 구조 동일 | 개발자 |
Heavy 플랜의 16개 에이전트는 이름이 있는 4개 페르소나가 16명으로 늘어나는 게 아닙니다. 더 많은 특화 레플리카가 병렬로 가설을 탐색하는 구조입니다. 역할 분류 자세한 내용은 공식 발표가 없는 상태입니다. 쓸 만한 경우는 다중 도메인이 얽힌 학술 연구, 극도로 긴 문서 분석, 엔터프라이즈 전략 검토 정도입니다.
솔직히 말하면, 일반 업무용으로는 $30짜리 기본 4에이전트로 충분합니다. Heavy의 16에이전트가 10배 더 잘 한다는 공식 수치는 아직 없고, Elon Musk의 “extremely fast for deep analysis” 발언(출처: @elonmusk X 게시글, 2026.03.12) 외에 독립 벤치마크 비교가 나오지 않았습니다. $300는 기능이 아닌 규모에 내는 돈입니다.
실제 한계 — 3월 20일에 벌어진 일
⚠️ 실사용자 리포트 — 2026년 3월 20일 기준
2026년 3월 20일, Reddit r/grok 커뮤니티에 “SuperGrok 구독인데 이미지 생성이 50번도 안 되고 막힌다”는 글이 올라왔습니다. 댓글에서 사용자들이 확인한 숫자는 30~50회 수준이었고, 무료 계정은 5~35회까지 줄었다고 보고했습니다. (출처: reddit.com/r/grok, 2026.03.20) xAI가 공식 이유를 밝히지 않은 부분입니다.
커스텀 인스트럭션 한도도 조용히 줄었습니다. Grok 4.1까지는 12,000자까지 커스텀 지시를 넣을 수 있었는데, Grok 4.20에서 4,000자로 줄었습니다. (출처: basenor.com, 2026.03.09) 줄인 이유는 “에이전트 정의를 짧고 명확하게 해야 성능이 좋다”는 논리인데, 이미 12,000자 기준으로 세팅해 쓰던 파워 유저에게는 마이그레이션이 필요한 변경입니다.
Grok 4.20은 기술적으로 인상적인 출시지만, 지금 이 글을 쓰는 시점(2026.03.31)에도 Beta 2가 최신이고 Beta 3가 개발 중입니다. Elon Musk가 “많은 수정과 기능 향상”을 예고했습니다. (출처: @elonmusk X 게시글, 2026.03.12) 지금 $30를 내면 완성된 제품이 아니라 개발 중인 제품의 가장 최신판을 쓰게 됩니다.
자주 묻는 질문
Q. Grok 4.20은 무료로 쓸 수 있나요?
기본 Grok은 무료지만 Grok 4.20 멀티에이전트 구조는 SuperGrok($30/월) 또는 X Premium+ 구독이 필요합니다. 무료 계정으로 앱에 접속하면 Grok 4.1 이하 모델만 사용 가능합니다. (출처: getaiperks.com, 2026.03.24)
Q. 에이전트 4개가 돌면 답이 4배 더 느린가요?
느려지지 않습니다. 4개가 병렬로 동시에 돌기 때문에 순차 처리가 아닙니다. xAI의 Colossus 인프라 위에서 공유 캐시로 실행되어 응답 속도는 단일 모델과 유사한 수준을 유지하도록 설계됐습니다. Elon Musk는 Heavy Beta 2를 “deep analysis에 극도로 빠르다”고 표현했습니다.
Q. Rapid Learning Architecture가 있으면 앞으로 업데이트를 별도로 받지 않아도 되나요?
앱을 수동으로 업데이트할 필요는 없습니다. 모델 자체가 매주 자동으로 갱신됩니다. 단, 같은 버전 번호(Grok 4.20) 아래 내부 성능이 변경되기 때문에 동일 프롬프트에 대한 재현성이 필요한 작업에서는 이 점을 감안해야 합니다.
Q. 커스텀 인스트럭션이 12,000자에서 4,000자로 줄었다면 기존 설정은 어떻게 되나요?
xAI가 마이그레이션 가이드를 공식적으로 제공하지 않았습니다. 기존에 12,000자 한도로 작성해 둔 커스텀 에이전트 설정이 있다면 직접 4,000자 이하로 압축해야 합니다. Grok 4.20 설계 의도는 에이전트 정의를 간결하게 유지할 때 더 안정적이라는 판단으로 보이지만, 공식 설명은 나오지 않았습니다.
Q. 65% 환각 감소라는 수치, 어디서 검증할 수 있나요?
xAI 공식 발표 및 aimaker.substack.com(2026.03.24) 분석에서 인용된 수치입니다. 구체적으로는 Grok 4.1의 환각률 약 12%에서 Grok 4.20의 약 4.2%로 감소한 것입니다. 독립적인 제3자 벤치마크 검증 결과는 현재(2026.03.31 기준) 공개된 자료가 제한적입니다. xAI 외부 기관의 공식 리포트가 나오면 추가 확인이 필요합니다.
마치며
Grok 4.20은 기술 설계 면에서 현재 시점 가장 흥미로운 AI 출시 중 하나입니다. 단일 모델이 아닌 4개 에이전트 시스템으로 환각률을 65% 줄인 구조, 매주 스스로 갱신하는 Rapid Learning Architecture, X 파이어호스 실시간 데이터 통합 — 이 세 가지는 Claude, GPT, Gemini가 현재 제공하지 않는 조합입니다.
그러나 지금 시점의 솔직한 평가는 이렇습니다. 2026년 3월 31일 현재 Beta 2가 최신이고, 한도 정책이 조용히 바뀌고 있으며, $300짜리 Heavy 플랜의 16에이전트 효과는 공식 수치로 아직 검증되지 않았습니다. $30 SuperGrok은 4개 에이전트의 핵심 구조를 쓰기에 적합하지만, 완성된 제품을 기대하고 들어가면 생각보다 거친 부분이 있습니다.
멀티에이전트 AI가 표준이 될 것인지는 Grok 4.20이 어느 정도 증명해가고 있습니다. Claude, GPT, Gemini가 6~12개월 내에 유사한 구조를 내놓을 가능성이 높고, 그때를 기준으로 비교하는 게 훨씬 쉬운 판단일 수 있습니다. 지금 당장 써야 할 이유가 있다면 — 실시간 X 데이터가 필요하거나, 복잡한 연구·코딩 검증에 내장 팩트체킹이 필요한 경우 — $30는 충분히 납득 가능한 가격입니다.
본 포스팅 참고 자료
- ① xAI 공식 Grok 4 발표 — https://x.ai/news/grok-4
- ② NextBigFuture — Grok 4.20 4에이전트 시스템 분석 (2026.02.17) — 바로가기
- ③ AI Maker Substack — Grok 4.20 멀티에이전트 심층 분석 (2026.03.24) — 바로가기
- ④ BASENOR — Grok 4.20 공식 출시 요약 (2026.03.09) — 바로가기
- ⑤ Puter Developer — Grok 4.20 Multi-Agent Beta API 스펙 (2026.03.12) — 바로가기
- ⑥ Reddit r/grok — 사용 한도 실사용자 보고 (2026.03.20) — 바로가기
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Grok 4.20은 2026년 3월 31일 기준 Beta 2 단계이며, xAI의 업데이트 주기에 따라 수치·요금·기능이 달라질 수 있습니다. 본 포스팅에 인용된 수치는 각 출처 원문 기준이며, 제3자 독립 검증이 필요한 항목은 본문 내 별도 표기했습니다.











댓글 남기기