Cursor Composer 2 써봤습니다 — 싸다는 말이 반만 맞습니다

Published on

in

Cursor Composer 2 써봤습니다 — 싸다는 말이 반만 맞습니다

2026.03.29 기준
Cursor 2.6.x 기준
Composer 2 / Composer 2 Fast

Cursor Composer 2 써봤습니다 — 싸다는 말이 반만 맞습니다

출시 하루 만에 Reddit이 뒤집혔습니다. “86% 저렴하다”는 Cursor의 발표는 맞습니다. 그런데 정작 중요한 건 따로 있었습니다 — 베이스 모델이 뭔지, SWE-bench에서 실제로 어디 서있는지, 그리고 Cursor 안에서만 쓸 수 있다는 게 무슨 의미인지입니다.

86%
Composer 1.5 대비 비용 절감
61.7%
Terminal-Bench 2.0 (Opus 4.6 = 58.0%)
$0.50/M
Standard 입력 토큰 단가

Composer 2가 뭔지 — 30초 요약

Cursor가 2026년 3월 19일 공개한 자체 코딩 모델입니다. Cursor 2.6.x 버전에서 에이전트 탭의 기본 모델로 설정되어 있고, Standard와 Fast 두 가지 버전이 있습니다. (출처: Cursor 공식 changelog, 2026.03.19)

결론부터 말씀드리면 — Cursor Pro를 쓰면서 크레딧을 빨리 소진하던 분께는 꽤 쓸만합니다. 같은 월정액 내에서 훨씬 많은 코딩 작업을 소화할 수 있습니다. 단, Cursor 바깥에서는 쓸 수 없고, 멀티파일 리팩토링과 터미널 작업이 주요 강점이며, 아키텍처 설계나 심화 추론이 필요한 작업에서는 Claude Opus 4.6이 여전히 앞섭니다.

Composer 1, 1.5에서 이어진 세 번째 버전이지만, 이전 버전과 달리 완전히 새로운 베이스 모델을 가져왔습니다. 그 부분이 핵심인데, 뒤에서 자세히 다룹니다.

▲ 목차로 돌아가기

베이스 모델이 Kimi K2.5라는 사실을 Cursor는 말하지 않았습니다

출시 당일 API 응답 헤더에서 발견된 정보

Composer 2 공개 당일, 한 개발자가 API 응답 헤더에서 kimi-k2p5-rl-0317-s515-fast라는 모델 식별자를 발견했습니다. Cursor는 그 다음 날인 3월 20일 Kimi K2.5가 베이스임을 공식 확인했습니다. (출처: VentureBeat, 2026.03.19 / NivaaLabs Research, 2026.03.24)

💡 공식 발표문과 API 실제 응답을 같이 놓고 보니 이런 차이가 보였습니다

Cursor의 공식 블로그에는 “자체 지속 사전학습(continued pretraining)과 강화학습을 적용했다”는 설명만 있고, Kimi K2.5를 베이스로 썼다는 언급이 없었습니다. 기술적으로 틀린 말은 아니지만, 베이스 모델이 중국 오픈소스 모델이라는 사실은 기업 보안 정책이 엄격한 팀에게는 충분히 검토가 필요한 정보입니다. Cursor는 현재 이 부분에 대해 공식 답변을 내놓지 않은 상태입니다.

Kimi K2.5가 어떤 모델인가

중국 AI 기업 Moonshot AI의 오픈소스 모델입니다. 공개된 SWE-bench Verified 점수는 76.8%이며, Cursor가 자체 사전학습과 강화학습을 적용한 Composer 2의 최종 성능은 공식 SWE-bench 수치로는 아직 독립 검증이 이루어지지 않았습니다. (출처: NivaaLabs, 2026.03.24)

약 25%의 계산 기반이 Kimi K2.5 원본 구조에서 온다고 Cursor VP of Developer Education이 밝혔습니다. 나머지는 Cursor의 도메인 특화 학습 결과입니다.

▲ 목차로 돌아가기

가격 86% 절감, 계산해보면 이렇습니다

Standard vs Fast vs 이전 모델 직접 비교

모델 입력 $/M 출력 $/M 캐시 읽기 $/M 비고
Composer 2 Standard $0.50 $2.50 $0.20 느리지만 최저가
Composer 2 Fast 기본값 $1.50 $7.50 $0.35 Standard와 동일 품질, 더 빠름
Composer 1.5 (구버전) $3.50 $17.50 $0.35 단종
Claude Opus 4.6 (API) $5.00 $25.00 Cursor 밖에서도 사용 가능
Claude Sonnet 4.6 (API) $3.00 $15.00 Cursor 밖에서도 사용 가능

출처: Cursor 공식 블로그(cursor.com/ko/blog/composer-2), NivaaLabs(2026.03.24), VentureBeat(2026.03.19)

86% 절감이 실제로 어떤 의미인지

Composer 1.5 기준 입력 토큰 100만 개당 $3.50이었던 게, Composer 2 Standard에서 $0.50으로 내려갔습니다. 계산식을 직접 확인해볼 수 있습니다.

절감율 역산:

(3.50 – 0.50) ÷ 3.50 × 100 = 85.7% ≈ 86%

출력 기준: (17.50 – 2.50) ÷ 17.50 × 100 = 85.7% ≈ 86%

Cursor Pro($20/월) 크레딧 풀에서 Composer 1.5 대신 Standard를 쓰면, 같은 크레딧으로 약 7배 더 많은 요청이 가능합니다.

단, Cursor Pro 구독자는 토큰 단가보다 크레딧 풀 소진 속도가 더 직접적인 체감 지표입니다. 메터링 청구(pay-as-you-go) 방식을 쓰는 팀이나 API 직접 호출이 잦은 경우에 절감 효과가 가장 크게 납니다.

▲ 목차로 돌아가기

벤치마크를 있는 그대로 읽는 법

Cursor가 Opus 4.6을 이겼다는 주장, 어디까지 맞나

공개된 수치를 표로 정리했습니다. 세 가지 벤치마크가 서로 다른 결과를 보이고 있기 때문에, 어느 하나만 보고 결론을 내리면 왜곡이 생깁니다.

벤치마크 Composer 2 Opus 4.6 Sonnet 4.6 GPT-5.4
SWE-bench Verified ~76.8%* 80.8% ✅ 79.6%
Terminal-Bench 2.0 61.7% ✅ 58.0% ~52.1% 75.1% 🏆
CursorBench 61.3% ✅ N/A N/A N/A
GPQA Diamond 미적용 91.3% ✅ 74.1%

*Composer 2의 SWE-bench 점수는 베이스 모델 Kimi K2.5 기준. 파인튜닝 후 독립 검증은 2026.03.24 기준 미완료. 출처: Cursor 공식 블로그, NivaaLabs(2026.03.24), VentureBeat(2026.03.19)

💡 CursorBench는 Cursor 팀 내부 코드베이스로 만든 자체 벤치마크입니다. 공개 저장소를 쓰지 않아 학습 데이터 오염 문제를 피할 수 있지만, 그만큼 외부에서 직접 재현하거나 검증하기 어렵습니다. “공정성”과 “검증 가능성”이 상충하는 구조입니다.

Terminal-Bench에서 Cursor가 Opus를 이긴 건 맞지만

Terminal-Bench 2.0에서 Composer 2(61.7%) > Opus 4.6(58.0%)인 건 사실입니다. 이 벤치마크는 CLI 환경에서 에이전트가 얼마나 잘 작동하는지를 측정하는데, Cursor 내부 작업 흐름과 가장 유사합니다. (출처: Cursor 공식 블로그, 2026.03.19 / Terminal-Bench 공식 리더보드 tbench.ai)

하지만 전체 코딩 능력을 가장 폭넓게 반영하는 SWE-bench Verified에서는 Kimi K2.5 베이스 기준 76.8%로, Opus 4.6(80.8%)과 Sonnet 4.6(79.6%) 모두에 뒤집니다. 이 수치가 Cursor 파인튜닝 후 어떻게 바뀌었는지는 공식적으로 발표되지 않았습니다.

▲ 목차로 돌아가기

Cursor 안에서만 쓸 수 있다는 게 생각보다 큰 문제입니다

Composer 2는 외부 API나 다른 IDE에서 호출이 안 됩니다

이건 단순한 제약이 아닙니다. Claude Opus 4.6이나 Sonnet 4.6은 Cursor 모델 선택창, Claude Code, API 호출, claude.ai 전부에서 씁니다. Composer 2는 Cursor IDE 하나에만 묶여 있습니다. (출처: Cursor 공식 모델 문서, 2026.03.19)

💡 Cursor가 “단순한 Anthropic/OpenAI 재판매 채널”에서 벗어나려는 전략이 이 모델에 담겨 있습니다. 하지만 그 전략이 개발자 입장에서는 IDE 종속으로 이어집니다. Composer 2의 경쟁력이 높아질수록, Cursor를 떠나기가 어려워지는 구조입니다.

컨텍스트 윈도우 차이도 무시하기 어렵습니다

Composer 2의 컨텍스트 윈도우는 200,000토큰입니다. Claude Opus 4.6과 Sonnet 4.6은 베타 기준 최대 100만 토큰까지 지원합니다. 차이는 5배입니다. 대규모 모노레포나 전체 저장소를 한 번에 들고 작업해야 하는 경우, 200K 한도에서 컨텍스트 잘림 문제가 발생할 수 있습니다. (출처: Anthropic 공식 문서, NivaaLabs 2026.03.24)

최대 출력 토큰도 Opus 4.6은 128,000토큰인 반면, Composer 2의 최대 출력 한도는 공식 문서에 명시되어 있지 않습니다. 전체 파일 diff나 대규모 테스트 스위트를 한 번에 생성해야 하는 작업에서 체감 차이가 날 수 있습니다.

▲ 목차로 돌아가기

실사용 평가 — Reddit 반응과 공식 수치를 같이 놓고 보면

Reddit r/cursor에서 나온 평가들

3월 19~25일 사이 올라온 실제 반응은 크게 세 가지로 나뉩니다.

✅ 긍정 평가

“Composer 2 Fast는 반응이 엄청 빠르다. 10분의 1 가격으로 80~90% 작업은 소화된다.”

⚠️ 혼재 평가

“50% 감탄, 50% 답답함. Sonnet 4.6이나 Opus 4.6 쓰던 거랑 비교하면 복잡한 작업에서 차이 난다.”

❌ 부정 평가

“Composer 1.5보다 더 나쁜 거 아닌가? 가격이 싸면 매개변수가 적다는 뜻이고, 실제로 그게 느껴진다.”

Reddit 반응만 보면 논란처럼 보이지만, 맥락을 보면 다릅니다. 부정 평가의 대부분은 “Opus 4.6이나 Sonnet 4.6 대비”입니다. 그 비교가 맞다면 Composer 2는 단순히 저가 대안이 됩니다. 하지만 “Cursor 안에서의 비용 효율”을 기준으로 하면 이야기가 달라집니다.

💡 Cursor의 에이전트 사용자 수가 Tab 사용자를 2배 이상 앞지른 건 2026년 2월 이후입니다. 2025년 3월만 해도 Tab 사용자가 에이전트 사용자보다 2.5배 많았습니다. 1년 사이에 완전히 뒤집힌 셈입니다. (출처: Cursor 공식 블로그 “AI 소프트웨어 개발의 세 번째 시대”, 2026.02.26)

이 흐름 속에서 Composer 2는 “에이전트 코딩을 더 저렴하게 많이 쓰게 하자”는 방향성으로 읽힙니다. 즉, 최고 품질 모델을 목표로 만든 게 아닙니다.

▲ 목차로 돌아가기

누구한테 맞고 누구한테 안 맞는가

Composer 2(Fast)가 잘 맞는 경우

Cursor Pro를 이미 쓰고 있고, 주된 작업이 멀티파일 리팩토링, 버그 수정, 기능 구현이라면 Composer 2 Fast를 기본으로 두고 가도 괜찮습니다. 크레딧 소모 속도가 Composer 1.5 대비 약 7배 느려지기 때문에, 같은 $20 월정액으로 훨씬 더 많은 작업을 돌릴 수 있습니다. 속도도 공식 기준으로 Anthropic 모델 대비 정규화 TPS(초당 토큰 수)가 높은 편입니다. (출처: Cursor 공식 블로그, 2026.03.19, 2026.03.18 Cursor 트래픽 스냅샷 기준)

Claude Opus 4.6이나 Sonnet 4.6이 더 맞는 경우

아키텍처 설계, 시스템 설계 검토, 보안 리뷰처럼 코딩 외의 추론이 필요한 작업이라면 Composer 2는 맞지 않습니다. 공식적으로 코딩 전용으로 설계되었고, GPQA Diamond(과학적 추론) 점수는 공개조차 되지 않았습니다. 또한 다중 에이전트 병렬 작업(Agent Teams)이 필요하다면 Opus 4.6이 유일한 선택지입니다. Sonnet 4.6과 Composer 2를 비교하면, Cursor 안에서의 비용은 Composer 2 Fast($1.50/M 입력)가 Sonnet 4.6($3.00/M)보다 2배 저렴하지만, SWE-bench 기준 코딩 품질은 Sonnet 4.6이 앞설 가능성이 높습니다. 그리고 Sonnet은 Cursor 밖에서도 씁니다.

⚠️ 기업 보안 정책이 엄격한 팀은 추가 검토 필요

베이스 모델이 중국 기업의 오픈소스 모델임을 사전에 공개하지 않은 점은, 모델 출처 투명성을 요구하는 기업 정책에 걸릴 수 있습니다. Cursor가 이 부분에 대해 공식적인 입장을 아직 내지 않았기 때문에, 엔터프라이즈 도입 전에 법무·보안 팀 검토를 권장합니다.

▲ 목차로 돌아가기

Q&A

Q1. Cursor Pro 구독자는 Composer 2를 추가 요금 없이 쓸 수 있나요?

Cursor Pro($20/월) 구독에는 Composer 모델 전용 사용량 풀이 별도로 포함됩니다. 풀 한도 내에서는 추가 과금 없이 씁니다. 단, 풀을 초과하면 토큰 단가로 청구됩니다. Cursor 공식 문서(cursor.com/ko/docs/models-and-pricing) 기준입니다.
Q2. Standard와 Fast 중 어느 걸 선택해야 하나요?

Cursor가 Fast를 기본값으로 설정했습니다. 품질은 동일하고 빠른 쪽이 Fast입니다. Standard($0.50/M 입력)는 Fast($1.50/M 입력)보다 3배 저렴하지만 응답 속도가 느립니다. 긴 리팩토링 작업에서 응답 대기가 길어질 수 있어, 대부분의 경우 Fast가 권장됩니다.
Q3. Composer 2가 Claude Opus 4.6보다 낫다고 볼 수 있나요?

Terminal-Bench 2.0에서는 Composer 2(61.7%) > Opus 4.6(58.0%)이 맞습니다. 그러나 SWE-bench Verified에서는 Kimi K2.5 베이스 기준 76.8%로 Opus 4.6(80.8%)에 뒤집니다. 비용 대비 성능은 Composer 2가 압도적이지만, 순수 코딩 능력 천장은 Opus 4.6이 높습니다. 두 모델이 싸우는 벤치마크가 다릅니다.
Q4. Kimi K2.5 기반이라는 게 성능에 영향을 주나요?

Kimi K2.5는 공개된 SWE-bench 점수 기준 상위권 모델입니다(76.8%). Cursor가 추가 사전학습과 강화학습을 적용했기 때문에 성능이 올라갔을 가능성이 있지만, 독립 검증이 아직 이루어지지 않았습니다. 베이스가 중국 오픈소스라는 사실이 성능에 직접적인 영향을 준다고 볼 근거는 없으나, 기업 보안 정책 측면에서 검토가 필요할 수 있습니다.
Q5. Cursor를 쓰지 않는다면 Composer 2를 사용할 방법이 있나요?

없습니다. Composer 2는 Cursor IDE 전용이며 외부 API를 통한 호출을 지원하지 않습니다. 베이스 모델인 Kimi K2.5는 오픈소스로 Moonshot AI에서 공개되어 있지만, Cursor의 파인튜닝 버전인 Composer 2는 Cursor 밖에서 사용할 수 없습니다. (출처: Cursor 공식 모델 문서, 2026.03.19)

▲ 목차로 돌아가기

마치며

솔직히 말하면, Composer 2는 “Cursor를 쓰는 개발자가 크레딧을 아끼면서 에이전트 코딩을 많이 하게” 하려는 모델이지, 모든 면에서 최고를 목표로 만든 게 아닙니다. 그걸 알고 쓰면 기대에 맞는 도구입니다.

아쉬운 건 두 가지입니다. 베이스 모델 출처를 처음부터 공개하지 않은 것, 그리고 SWE-bench Verified 공식 수치를 내놓지 않은 것. 이 두 가지가 없었다면 논란 없이 깔끔한 출시였을 겁니다. 막상 써보니 아쉬웠습니다.

Cursor Pro를 쓰면서 Opus 4.6 크레딧 소진이 빠르다고 느꼈다면, Composer 2 Fast를 기본값으로 두고 복잡한 작업에서만 Sonnet 4.6이나 Opus 4.6으로 전환하는 혼합 전략이 현실적입니다. 이미 Claude Code를 터미널에서 주로 쓴다면 이번 발표는 크게 달라지는 게 없습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Cursor 공식 블로그 — Composer 2 발표 (2026.03.19)
  2. Cursor 공식 블로그 — CursorBench 소개 및 벤치마크 방법론
  3. Cursor 공식 Changelog (2026.03 기준)
  4. VentureBeat — Cursor Composer 2 분석 (2026.03.19)
  5. NivaaLabs — Composer 2 vs Opus 4.6 vs Sonnet 4.6 상세 비교 (2026.03.24)
  6. Cursor 공식 블로그 — AI 소프트웨어 개발의 세 번째 시대 (2026.02.26)

⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 본문의 모든 수치는 2026년 3월 29일 기준이며, Cursor 2.6.x / Composer 2 출시 직후 공개된 공식 자료를 기반으로 작성되었습니다. 벤치마크 수치는 각 출처의 측정 방법론 및 시점에 따라 달라질 수 있으며, 독립 검증이 완료되지 않은 항목은 본문에 별도 표기했습니다.

댓글 남기기


최신 글

  • 보육료 전환 신청 2026, 양육수당 중복 체크
    보육료 전환 신청 2026 기준으로 입소일과 신청일, 양육수당·부모급여, 보육료 자격 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청년월세지원 신청 2026, 임대차 서류 체크
    청년월세지원 신청 2026 기준으로 나이·거주 요건, 계약서와 이체 내역, 본인·원가구 소득 확인 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민취업지원제도 신청 2026, 구직촉진수당 체크
    국민취업지원제도 신청 2026 기준으로 유형과 자격, 월 소득과 재산, 구직활동 계획 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민연금 반환일시금 청구 2026, 수급 조건 확인
    국민연금 반환일시금 청구 2026 기준으로 10년 기준, 연령·국외이주 등, 신분·계좌·증빙 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 건강보험 환급금 조회 2026, 본인부담금 확인
    건강보험 환급금 조회 2026 기준으로 공식 화면 여부, 발생 사유, 본인 명의 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 주택청약 당첨 포기 2026, 재당첨 제한 체크
    주택청약 당첨 포기 2026 기준으로 주택 유형과 지역, 일정과 통장 영향, 사유와 소명 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기