Composer 2 정식 출시
TECH
Cursor Composer 2, 6분의 1 가격이 조건이 있습니다
Cursor가 2026년 3월 19일 공개한 Composer 2는 “Claude 4.6 Sonnet 대비 출력 토큰 6분의 1 가격”이라는 말이 먼저 퍼졌습니다. 결론부터 말하면, 그 가격은 Standard 버전 기준이고 제품 기본값은 Fast 버전입니다. 공식 문서와 벤치마크 수치를 직접 확인한 내용을 정리합니다.
Cursor Composer 2가 등장한 배경
Cursor는 2025년 10월 Composer 1을 처음 공개하면서 “코드만을 위해 만든 자체 모델”이라는 방향을 선언했습니다. 기존에는 OpenAI, Anthropic 등 외부 API를 그대로 연결해 쓰는 구조였는데, Composer 1부터는 Cursor가 직접 학습시킨 코드 전용 모델을 IDE에 통합하는 방식으로 바뀌었습니다. Composer 2는 그 두 번째 버전으로, 2026년 3월 19일에 정식 출시됐습니다. (출처: Cursor 공식 블로그, 2026.03.19)
핵심 차별점은 학습 데이터입니다. 일반 LLM이 문학, 뉴스, 소셜 미디어 등 광범위한 텍스트로 학습하는 것과 달리, Composer 2는 코드 데이터만으로 학습됐습니다. 파라미터 전체를 프로그래밍 구문, 아키텍처 패턴, 의존성 관리에 집중시킨 구조입니다. 이게 성능이 아니라 가격에서도 유리한 고지를 점하는 직접적인 이유입니다.
Cursor의 기업 가치가 500억 달러 수준으로 논의되는 시점에 출시된 점도 눈에 띕니다. 단순히 IDE 도구를 공급하는 게 아니라, 자체 모델 스택을 직접 통제하는 AI 인프라 기업으로의 전환을 선언한 셈입니다. (출처: creati.ai, 2026.03.21)
공식 벤치마크 수치, 직접 확인했습니다
Cursor는 CursorBench, Terminal-Bench 2.0, SWE-bench Multilingual 세 가지 지표로 Composer 버전별 성능을 공개했습니다. 아래 표는 공식 블로그(2026.03.19)에 나온 수치를 그대로 옮긴 겁니다.
| 모델 | CursorBench | Terminal-Bench 2.0 | SWE-bench Multilingual |
|---|---|---|---|
| Composer 2 | 61.3 | 61.7 | 73.7 |
| Composer 1.5 | 44.2 | 47.9 | 65.9 |
| Composer 1 | 38.0 | 40.0 | 56.9 |
(출처: Cursor 공식 블로그 composer-2, 2026.03.19)
Composer 2의 CursorBench 점수 61.3은 Composer 1(38.0) 대비 61% 향상된 수치입니다. 수치가 올라갔다는 것보다, 범용 최상위 모델과 직접 경쟁할 수 있는 선에 진입했다는 의미입니다. Terminal-Bench 2.0은 Laude Institute가 제공하는 독립 벤치마크로, Cursor가 직접 만든 CursorBench와 달리 제3자 수치입니다. (출처: tbench.ai 리더보드)
💡 공식 발표 수치와 독립 벤치마크 수치를 나란히 놓고 봤을 때 — CursorBench는 Cursor가 설계한 지표이고 Terminal-Bench 2.0은 외부 기관 지표인데, 두 가지 모두에서 Composer 2가 선두권에 들어간 점은 단순 자체 홍보와는 다른 무게를 가집니다.
“6분의 1 가격”이 정확하지 않은 이유
| 모델 | 입력 토큰 (1M) | 출력 토큰 (1M) | 비고 |
|---|---|---|---|
| Composer 2 Standard | $0.50 | $2.50 | 수동 선택 필요 |
| Composer 2 Fast 기본값 | $1.50 | $7.50 | 제품 기본 설정 |
| Claude 4.6 Sonnet | $3.00 | $15.00 | 범용 모델 |
(출처: Cursor 공식 Docs — models-and-pricing, Cursor 공식 블로그 composer-2, 2026.03.19)
퍼진 “6분의 1 가격”은 Claude 4.6 Sonnet 출력 토큰($15.00) 대비 Composer 2 Standard($2.50)를 비교한 수치로, 이 계산 자체는 맞습니다. 그런데 제품 기본값이 Standard가 아니라 Fast입니다. Cursor 공식 Docs에 “Fast is the default in the product”라고 직접 쓰여 있습니다. Fast 기준으로 계산하면 출력 토큰 $7.50, Claude 4.6 Sonnet 대비 정확히 2분의 1 수준입니다.
한 가지 더 확인할 게 있습니다. Cursor 공식 블로그(2026.03.18 기준)에 따르면, Fast 버전은 초당 토큰 생성 속도(TPS)를 높이기 위해 Anthropic을 포함한 여러 프로바이더에서 15% 추가 비용을 내고 연산 자원을 확보합니다. Standard 대비 3배 비싼 이유가 성능 차이가 아니라 속도 확보를 위한 인프라 비용이라는 점이 공식 문서에 명시돼 있습니다. 속도만 빠르고 성능은 동일합니다.
⚠️ 실제로 Standard로 바꿔 쓰면 동일한 성능을 3분의 1 비용으로 쓸 수 있습니다. 단, Cursor 설정에서 직접 변경해야 합니다. 기본 상태로 쓰면 자동으로 Fast 요금이 적용됩니다.
긴 작업에서 무너지지 않는 이유가 있습니다
에이전트형 코딩에서 항상 문제가 되는 건 대화가 길어질수록 앞 맥락을 잊어버리는 컨텍스트 손실입니다. Composer 1도 이 문제에서 자유롭지 않았습니다. Cursor 연구팀이 2026년 3월 17일 공개한 기술 글에서 이를 해결한 방식을 설명했습니다. 이름은 “자체 요약(self-summarization)”입니다. (출처: Cursor 공식 블로그 self-summarization, 2026.03.17)
작동 방식은 이렇습니다. Composer가 작업을 진행하면서 컨텍스트 창이 일정 임계치(80k 토큰)에 도달하면, 모델이 스스로 지금까지의 작업 내용을 요약합니다. 이 요약된 내용이 새로운 컨텍스트로 교체되면서 창이 절반 이하(40k 토큰)로 줄어듭니다. 이 과정을 반복하면 이론상 무한히 긴 작업도 처리할 수 있습니다.
💡 공식 연구 자료와 벤치마크 수치를 함께 놓고 보니 이런 차이가 보였습니다 — Composer 2는 Terminal-Bench 2.0에서 “make-doom-for-mips” 과제를 자력으로 완료했습니다. MIPS VM 위에서 DOOM을 동작시키는 멀티스텝 작업인데, Cursor 연구팀이 이 과제를 해결하는 데 자체 요약이 핵심 역할을 했다고 공식 블로그에서 밝혔습니다. 긴 작업 내구성이 단순 마케팅 표현이 아니라 측정 가능한 수치로 검증됐다는 의미입니다.
공식 블로그에 따르면, 자체 요약 없이 동일 작업을 진행했을 때 CursorBench 성능이 약 50% 감소했고, KV 캐시 비용은 5분의 1로 줄었습니다. 요약이 품질 하락 없이 비용도 함께 낮추는 구조입니다. 짧게 쓸수록 싸다는 게 아니라, 길게 써도 비용이 통제된다는 점이 핵심입니다.
실사용에서 막히는 조건 2가지
벤치마크 수치와 실사용 사이에는 항상 갭이 있습니다. Reddit r/cursor 커뮤니티의 실사용 후기들을 정리하면 두 가지 조건에서 한계가 명확합니다.
① 복잡도가 높은 작업에서 검수 부담이 늘어납니다
Composer 1 초기부터 제기된 문제인데, Composer 2도 완전히 해소되지 않았습니다. 여러 파일에 걸친 복잡한 로직 변경이나 ML 파이프라인 구축처럼 고복잡도 작업에서는 GPT-5나 Claude Sonnet 4.6 대비 실수가 많고 코드가 컴파일되지 않는 경우가 보고됩니다. (출처: Reddit r/cursor 사용자 nuclearmeltdown2015, 2025.11) 속도와 비용이 유리한 대신, 출력 결과를 더 꼼꼼히 검토해야 하는 비용이 생깁니다.
② 단독으로 쓰면 성과가 반감됩니다
Reddit 커뮤니티에서 가장 많이 공유된 사용 패턴은 “기획은 GPT-5나 Claude로, 구현은 Composer”입니다. Composer 2가 지시 사항을 따르는 실행 능력은 뛰어나지만, 복잡한 문제를 처음부터 설계하는 계획 수립 단계에서는 범용 모델을 먼저 쓰는 게 효율적입니다. 이 조합을 모르고 단독으로 고복잡도 작업을 시작하면 기대에 못 미칩니다. Composer 2는 설계 후 실행 단계에서 빛납니다.
두 번째 한계는 단점이라기보다 역할 분리의 문제입니다. Cursor 공식 블로그 자체에도 Composer는 “에이전트형 실행”에 특화됐다고 설명합니다. 계획과 실행을 같은 도구로 한 번에 처리하려는 시도보다, 계획 단계에서 다른 모델을 활용한 뒤 Composer로 넘기는 워크플로우가 실제로 더 높은 성과를 냅니다.
공식 발표문과 실제 사용 흐름을 같이 놓고 보면
Cursor가 자체 모델을 직접 만들기 시작한 시점과, 이번 Composer 2 출시가 맞물리면서 하나의 흐름이 보입니다. 이 부분은 기존 기사들이 잘 다루지 않았는데, 공식 발표 자료를 교차해서 읽어보면 다른 그림이 나옵니다.
🔍 비용 구조에서 보이는 것
Cursor는 Composer 2 Fast 버전의 가격이 Standard보다 3배 비싼 이유를 “TPS(초당 토큰 생성 속도) 확보를 위한 인프라 비용”이라고 직접 밝혔습니다. (출처: Cursor 공식 블로그, 2026.03.19) 이 말은 Cursor가 아직 자체 GPU 클러스터를 완전히 통제하지 못하고 Anthropic 등 외부 인프라에 프리미엄을 내고 있다는 뜻입니다. 학습은 자체 데이터로 했지만, 추론 인프라는 일부 외부 의존도가 남아 있습니다. Fast가 비싼 것은 모델이 뛰어나서가 아니라 Cursor가 속도를 보장하기 위해 추가 비용을 내기 때문입니다.
🔍 자체 벤치마크를 직접 설계했다는 것의 의미
CursorBench는 Cursor가 직접 설계한 평가 지표입니다. Cursor 공식 블로그(2026.03.11)에 따르면, SWE-bench처럼 이미 공개된 벤치마크는 상위 60% 정확도 도달 후 모델들이 데이터를 외워버리는 문제가 생겨 신뢰도가 떨어졌기 때문에 자체 기준을 만들었다고 합니다. 이 맥락에서 “CursorBench 61.3점”은 Cursor가 유리한 조건을 자신이 설계했을 가능성도 함께 읽어야 합니다. Terminal-Bench 2.0처럼 독립 지표를 병행해서 보는 게 현명합니다.
두 관점을 합치면 Composer 2의 실질적 포지션이 더 뚜렷해집니다. 빠른 속도와 낮은 비용 사이에서 사용자가 직접 선택해야 하고, 자체 평가 지표의 맥락을 이해하며 써야 하는 도구입니다. 그냥 기본값으로 쓰면 “6분의 1 가격” 혜택의 절반도 못 누립니다.
자주 묻는 질문 Q&A
마치며
Composer 2는 확실히 의미 있는 발표입니다. 코드 전용 학습, 자체 요약 기술, 그리고 공식 벤치마크에서 확인된 수치들은 단순한 버전 업데이트가 아니라 AI 코딩 도구의 방향 자체를 바꾸는 시도입니다.
다만 “6분의 1 가격”을 그대로 믿고 들어오면 기대와 다를 수 있습니다. 기본값이 Fast라는 점, 고복잡도 작업에서는 단독 사용보다 역할 분리가 유리하다는 점, CursorBench는 자체 지표라는 점을 알고 쓰는 것과 모르고 쓰는 것의 체감 차이는 꽤 큽니다.
솔직히 말하면, 지금 당장 Claude나 GPT-5를 전부 끊을 이유는 없습니다. 대신 반복적인 구현 작업이 많다면, 기본값을 Standard로 바꾼 Composer 2는 비용 대비 꽤 실용적인 선택입니다.
📎 본 포스팅 참고 자료
- Cursor 공식 블로그 — Composer 2 출시 발표 (https://cursor.com/ko/blog/composer-2)
- Cursor 공식 블로그 — 자체 요약(self-summarization) 기술 설명 (https://cursor.com/ko/blog/self-summarization)
- Cursor 공식 블로그 — CursorBench 설계 및 방법론 (https://cursor.com/ko/blog/cursorbench)
- Terminal-Bench 2.0 리더보드 (https://www.tbench.ai/leaderboard/terminal-bench/2.0)
- Reddit r/cursor — Composer 실사용 후기 스레드 (https://www.reddit.com/r/cursor/comments/1oqfpob/)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Cursor Composer 2 관련 내용은 2026.03.19 기준이며, 이후 업데이트로 가격·성능·기본 설정이 달라질 수 있습니다.











댓글 남기기