GitHub Copilot 프리미엄 요청, 30x 모델 쓰면 Pro+ 50번에 끝납니다

Published on

in

GitHub Copilot 프리미엄 요청, 30x 모델 쓰면 Pro+ 50번에 끝납니다

2026.04.15 기준
GitHub Copilot Pro / Pro+ / Business

GitHub Copilot 프리미엄 요청, 30x 모델 쓰면 Pro+ 50번에 끝납니다

월 $39 내고 최상위 모델 선택했을 때 한 달 쓸 수 있는 횟수가 생각보다 훨씬 적습니다. multiplier 구조를 모르면 월 중반에 기본 모델로 강제 전환됩니다.

30x
Opus 4.6 fast mode multiplier
50회
Pro+ 한도 소진까지 상호작용
0.33x
가장 저렴한 모델 multiplier

프리미엄 요청이란, 처음부터 다시 잡기

GitHub Copilot을 월정액으로 내고 쓰면 “그냥 다 되는 것” 같지만, 실제로는 두 개의 사용 계층이 공존합니다. 인라인 코드 완성(inline suggestions)은 유료 플랜 기준 무제한이고, 프리미엄 요청(premium requests)은 월별 한도가 따로 있습니다. 채팅, 에이전트 모드, 코드 리뷰, Copilot CLI 등 고급 기능은 이 프리미엄 요청을 소비합니다.

2025년 6월 18일부터 유료 플랜 전체에 프리미엄 요청 과금이 시작됐습니다. (출처: GitHub 공식 문서 — Copilot requests) 그 이전에는 모델을 선택해도 요청 수가 줄지 않는 구조였기 때문에, 오래된 글이나 2024년 기준 정보는 지금과 다릅니다.

💡 공식 문서와 실제 사용 흐름을 같이 놓고 보니, 월정액 구조 안에 사실상의 종량제가 내재돼 있다는 점이 보였습니다. 과거에 통했던 “무제한” 감각을 그대로 적용하면 월 중반에 막힙니다.

▲ 목차로 돌아가기

플랜별 월 한도와 실제 쓸 수 있는 횟수 계산

GitHub Copilot 개인 플랜 기준으로, 프리미엄 요청 월 한도는 아래와 같습니다. (출처: GitHub 공식 문서 — Individual plans)

플랜 월 가격 프리미엄 요청/월 초과 단가
Free $0 50개 불가
Pro $10 300개 $0.04/개
Student 무료 300개 $0.04/개
Pro+ $39 1,500개 $0.04/개
Business $19/인 300개/인 $0.04/개

숫자만 보면 Pro+의 1,500개가 넉넉해 보입니다. 문제는 모델마다 소비하는 요청 수가 다르다는 점입니다. 여기에 multiplier 구조가 숨어 있습니다. 기본 포함 모델인 GPT-5 mini, GPT-4.1, GPT-4o는 유료 플랜에서 프리미엄 요청을 전혀 소비하지 않습니다. 반면 고급 모델로 전환하는 순간 한도가 빠르게 줄기 시작합니다.

▲ 목차로 돌아가기

30x의 실체 — Pro+ 쓰면 50번에 끝납니다

모델 multiplier 계층 전체 구조

GitHub Copilot 공식 문서에 명시된 모델 multiplier를 정리하면 다음과 같습니다. (출처: GitHub 공식 문서 — Model multipliers)

모델 (예시) multiplier Pro(300개) 기준 Pro+(1,500개) 기준
GPT-5 mini, GPT-4o (포함 모델) 0x 무제한 무제한
Claude Haiku 4.5, Gemini 3 Flash 0.33x 약 909회 약 4,545회
Claude Sonnet 4.6, GPT-5.1, Gemini 2.5 Pro 1x 300회 1,500회
Claude Opus 4.5, Claude Opus 4.6 3x 100회 500회
Claude Opus 4.6 (fast mode) 30x 10회 50회

Pro+ 사용자가 Claude Opus 4.6 fast mode를 쓰면 한 달 한도(1,500개)가 단 50번의 상호작용으로 바닥납니다. 월 $39를 낸 대가로 쓸 수 있는 대화가 하루 평균 2번도 안 된다는 계산입니다. 일반 Opus 4.6(3x)도 500회로 하루 16번 수준이니, 에이전트 모드로 집중적으로 쓰는 날에는 며칠 안에 소진됩니다.

💡 GitHub Copilot 팀 담당자(KateCatlinGitHub)는 Reddit에서 “fast mode는 기본 선택이 아니며 Auto 모드에서는 절대 선택되지 않는다”고 직접 밝혔습니다. 의도치 않게 빠져들 가능성은 낮지만, 모델 피커에서 직접 선택한 순간 30x가 즉시 적용됩니다. (출처: Reddit r/github, 2026.02.17)

2026년 2월 16일까지는 프로모션 가격(9x)이 적용됐지만, 이후 공식 30x로 전환됐습니다. 프로모션 기간에 쓰던 속도감을 그대로 기대하면 비용이 3배 이상 뛴다는 점을 감안해야 합니다. (출처: GitHub Changelog, 2026.02.07)

▲ 목차로 돌아가기

tool call은 카운트된다? 공식 문서가 말하는 진실

“에이전트 모드에서 AI가 자율적으로 파일을 열고 터미널 명령을 실행할 때마다 요청이 차감된다”고 생각하는 경우가 많습니다. 직관적으로는 그럴 것 같고, 실제로 2026년 3월 일시적인 버그가 있었을 때도 많은 사람이 이를 “새 정책”이라 오해했습니다.

공식 문서는 분명합니다. “에이전트 기능에서는 사용자가 직접 보낸 프롬프트만 프리미엄 요청으로 카운트된다. Copilot이 작업을 완수하기 위해 자율적으로 실행하는 tool call은 카운트되지 않는다.” (출처: GitHub 공식 문서 — Copilot requests) 내가 보낸 프롬프트 1개 = 1 × 해당 모델 multiplier, 이것이 전부입니다.

💡 2026년 3월 2일 Reddit에서 “Opus 4.6 프롬프트 하나에 프리미엄 요청이 30개 이상 차감됐다”는 신고가 쏟아졌고(r/GithubCopilot, 점수 155), GitHub 팀은 당일 버그임을 인정하고 수정했습니다. 그 사태가 남긴 교훈은 하나입니다. tool call 카운트 오류는 언제든 재발할 수 있으니, github.com/settings/billing/premium_requests_usage에서 정기적으로 사용량을 직접 확인하는 습관이 필요합니다.

단 예외가 있습니다. Copilot coding agent(클라우드 기반 자율 에이전트)는 세션 단위로 카운트되며, “세션 × 모델 multiplier”가 적용됩니다. Spark 기능은 프롬프트당 4 프리미엄 요청이 별도 SKU로 집계됩니다. 같은 “에이전트”라는 이름이라도 VS Code 에이전트 모드와 코딩 에이전트는 과금 방식이 다릅니다.

▲ 목차로 돌아가기

auto model selection 10% 할인, 거의 아무도 모릅니다

직접 모델을 고르는 것보다 자동 선택이 더 쌉니다

VS Code Copilot Chat에서 모델 피커를 “Auto”로 놔두면 10% 할인이 적용됩니다. Claude Sonnet 4.6을 직접 선택하면 1x이지만, Auto로 선택된 Sonnet 4.6은 0.9x로 계산됩니다. (출처: GitHub 공식 문서 — Auto model selection)

Pro 플랜 기준 Sonnet 4.6을 Auto로 쓰면 1x 대신 0.9x가 적용되어 월 300개 한도에서 333회 상호작용이 가능합니다. 직접 선택 시의 300회보다 33회 더 쓸 수 있다는 계산입니다. 팀 단위로는 수치가 달라집니다. 50명이 모두 Auto를 쓰면 월간 Sonnet 기준 약 1,650회 추가 상호작용을 확보하는 셈입니다.

💡 할인 적용 조건은 “VS Code에서 Auto 모드를 쓸 때”로 한정됩니다. JetBrains, GitHub.com 채팅, Copilot CLI에서는 동일 할인이 적용되지 않는다는 점이 공식 문서에 명시돼 있습니다. 플랫폼마다 과금 조건이 다릅니다.

Free 플랜 사용자는 이 할인이 적용되지 않습니다. Auto를 선택해도 full multiplier가 적용됩니다.

▲ 목차로 돌아가기

한도 초과 후 실제 어떻게 되는가 — 강제 전환 구조

월 한도를 다 쓰면 서비스가 중단되지는 않습니다. 유료 플랜 기준, 프리미엄 요청 소진 이후에도 기본 포함 모델(GPT-5 mini, GPT-4.1, GPT-4o)은 계속 사용할 수 있습니다. 단지 Claude Opus, Sonnet 같은 고급 모델 접근이 막힐 뿐입니다. (출처: GitHub 공식 문서)

추가 요청은 개당 $0.04에 별도 과금이 가능합니다. 조직 관리자가 “프리미엄 요청 유료 사용” 정책을 활성화하지 않으면 초과 자체가 불가합니다. 활성화돼 있으면 예산 상한 없이 청구될 수 있으니, 팀 단위 사용 시 반드시 budget cap 설정이 먼저입니다.

잔여 요청 수는 매월 1일 00:00 UTC에 초기화됩니다. 남은 요청은 이월되지 않습니다. 25일에 요청을 아껴도 월말에 그냥 사라집니다.

▲ 목차로 돌아가기

플랜별 실 비용 비교와 Claude Code와의 차이

모델 선택에 따라 실질 단가가 달라집니다

“Copilot Pro+가 Claude Code $100보다 싸다”는 판단은 어떤 모델을 쓰느냐에 따라 달라집니다. Opus 4.6(3x)을 하루 평균 10번씩 쓰는 개발자라면 Pro+ 1,500개 한도를 약 50일이면 소진합니다. 즉 2달에 1.5배치 분의 Pro+ 비용($58.5)이 드는 셈이고, 같은 빈도에서 Claude Code $100 플랜(5시간 리셋 + 주간 한도) 구조와 어느 쪽이 유리한지는 사용 패턴을 직접 계산해봐야 합니다.

시나리오 Copilot Pro ($10) Copilot Pro+ ($39)
Sonnet 1x, 하루 10회 10일 소진 50일 소진
Opus 4.6 3x, 하루 5회 20일 소진 100일 소진
Haiku 0.33x, 하루 30회 30일 충분 150일 이상
Opus fast mode 30x, 하루 3회 3.3일 소진 16.7일 소진

Haiku 4.5(0.33x)나 포함 모델을 주로 쓰는 사람이라면 Pro $10도 한 달이 충분합니다. 문제는 “고급 모델 = 더 좋은 결과”라는 기대로 Opus를 기본으로 설정해두는 습관입니다. 모델별 성능 차이가 실제 작업에 의미 있는 경우는 생각보다 적고, 대부분의 코드 완성이나 일반 채팅은 Sonnet 이하로도 충분합니다. (출처: NxCode Copilot 리뷰, 2026.03.20)

▲ 목차로 돌아가기

자주 묻는 질문

Q. 에이전트 모드에서 Opus 4.6을 쓰면 tool call 한 번마다 3개씩 줄어드나요?
아닙니다. 공식 문서 기준으로는 사용자가 보낸 프롬프트 1개만 카운트되고, Copilot이 자율적으로 실행하는 tool call은 카운트되지 않습니다. 다만 2026년 3월 2일 일시적으로 tool call도 카운트되는 버그가 발생한 적 있으니, 사용량이 평소보다 빠르게 줄어든다면 github.com/settings/billing/premium_requests_usage에서 직접 확인하는 것이 좋습니다.
Q. Pro 플랜에서는 어떤 모델이 프리미엄 요청을 소비하지 않나요?
Q. 프리미엄 요청이 남아있는데 월말에 이월되나요?
이월되지 않습니다. 매월 1일 00:00 UTC에 카운터가 초기화되며, 이전 달 잔여 요청은 사라집니다.
Q. Opus 4.6 fast mode와 일반 Opus 4.6 중 어느 쪽이 실용적인가요?
일반 Opus 4.6(3x) 대비 fast mode(30x)는 출력 속도가 최대 2.5배 빠르지만 비용이 10배입니다. GitHub 팀 담당자도 “빠른 응답이 결정적인 latency-sensitive 워크플로우가 아니라면 권장하지 않는다”고 밝혔습니다. 대부분의 작업에서 일반 Opus 4.6으로도 충분합니다.
Q. Enterprise 플랜에서는 데이터 잔류 옵션을 쓰면 비용이 더 드나요?
GitHub Enterprise Cloud에서 data residency(데이터 잔류) 또는 FedRAMP 강제 적용 옵션을 사용하면 multiplier에 10%가 추가됩니다. 예를 들어 Sonnet 4.6(1x)이 data residency 환경에서는 1.1x로 계산됩니다. 보안 요건으로 필수 선택인 경우 비용 계획 시 반영해야 합니다.

▲ 목차로 돌아가기

마치며

GitHub Copilot 프리미엄 요청 구조를 한 줄로 요약하면 이렇습니다. 포함 모델(GPT-5 mini, GPT-4.1, GPT-4o)을 쓰는 한 한도는 사실상 없고, 고급 모델로 넘어가는 순간 multiplier가 붙는다. 그리고 Opus 4.6 fast mode는 그 multiplier가 30x입니다.

솔직히 말하면, 대부분의 일상 작업은 Sonnet 4.6(1x)으로 충분합니다. 코드 완성, 리팩토링 제안, 단순 디버깅에서 Opus와 Sonnet의 차이를 체감하는 경우는 많지 않습니다. fast mode(30x)는 응답 속도가 극도로 중요한 라이브 데모나 집중 디버깅 세션 같은 특수한 상황을 위한 옵션으로 보는 게 맞습니다.

VS Code에서 모델을 Auto로 놔두면 10% 할인이 적용된다는 점, Spark와 coding agent는 별도 SKU로 집계된다는 점, tool call은 카운트되지 않는다는 점 — 이 세 가지를 알고 쓰는 것만으로도 같은 돈에 눈에 띄게 더 길게 씁니다.

이 글은 2026년 4월 15일 기준 공식 문서와 실사용 데이터를 토대로 작성했습니다. GitHub Copilot 요금제는 공지 없이 변경될 수 있으므로, 최신 수치는 공식 문서에서 직접 확인하는 것을 권합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. GitHub 공식 문서 — Copilot requests (프리미엄 요청 과금 구조)
  2. GitHub 공식 문서 — Individual plans (플랜별 한도)
  3. GitHub Changelog — Claude Opus 4.6 fast mode 공개 프리뷰 및 30x multiplier 적용 공지 (2026.02.07)
  4. GitHub 공식 문서 — Auto model selection (10% 할인 조건)
  5. NxCode — GitHub Copilot 리뷰 2026 (2026.03.20)

본 포스팅 작성 이후 서비스 정책·UI·모델 multiplier·기능이 변경될 수 있습니다. 최신 정보는 반드시 GitHub 공식 문서에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기