Composer 2 출시 2026.03.19
TECH
Cursor Composer 2, “자체 모델”이라는 말이 맞을까요?
2026년 3월 19일, Cursor가 자사 최초의 코딩 전용 모델 Composer 2를 전격 발표했습니다. 그런데 발표 하루 만에 개발자 한 명이 API 응답에서 수상한 모델 ID를 발견했습니다. kimi-k2p5-rl-0317-s515-fast. 자체 개발 모델이라 했는데, 그 안에 중국 AI 스타트업 Moonshot AI의 Kimi K2.5가 들어 있었습니다.
Cursor가 발표한 Composer 2, 공식 수치부터 짚어봤습니다
2026년 3월 19일 공개된 Cursor Composer 2는 Cursor가 처음으로 외부 모델(Claude, GPT 등)이 아닌 자사 훈련 코딩 특화 모델로 출시한 제품입니다. 공식 블로그에 따르면, 코드 전용 데이터로만 훈련해 세금 신고도, 시 작성도 안 되지만 대신 코딩만큼은 최전선 수준을 목표로 했습니다. (출처: cursor.com/ko/blog/composer-2, 2026.03.19)
벤치마크 수치는 실제로 인상적입니다. CursorBench에서 전작 Composer 1.5의 44.2점에서 61.3점으로 올라갔고, Terminal-Bench 2.0에서는 47.9에서 61.7로, SWE-bench Multilingual에서는 65.9에서 73.7로 뛰어올랐습니다.
| 모델 | CursorBench | Terminal-Bench 2.0 | SWE-bench Multi. |
|---|---|---|---|
| Composer 2 | 61.3 | 61.7 | 73.7 |
| Composer 1.5 | 44.2 | 47.9 | 65.9 |
| Claude Opus 4.6 | 58.2 | 58.0 | 77.8 |
| GPT-5.4 Thinking | 63.9 | 75.1 | N/A |
출처: cursor.com/ko/blog/composer-2 / the-decoder.com (2026.03.21) — Terminal-Bench 2.0 수치는 에이전트·하네스 설정에 따라 직접 비교에 한계가 있습니다.
가격은 API 기준으로 입력 100만 토큰당 $0.50, 출력 100만 토큰당 $2.50입니다. 기본값으로 제공되는 빠른 버전(Fast)은 입력 $1.50, 출력 $7.50이고, 이는 Claude Opus 4.6(입력 $5.00, 출력 $25.00)이나 GPT-5.4(입력 $2.50~$5.00)보다 훨씬 낮은 수준입니다. (출처: the-decoder.com, 2026.03.21)
모델 ID 한 줄이 모든 걸 바꿨습니다
발표 당일 개발자 Fynn이 Cursor API를 디버깅하다가 이상한 점을 발견했습니다. 응답으로 돌아온 모델 식별자가 “Composer 2″가 아니라 kimi-k2p5-rl-0317-s515-fast였습니다. 이 트윗은 444만 뷰를 기록했습니다. (출처: @fynnso on X, 2026.03.20)
💡 공식 발표문과 API 응답을 같이 놓고 보니 이런 차이가 보였습니다
Cursor가 공식 블로그에서 “자사 훈련 모델”이라 설명했지만, API 레벨에서는 Moonshot AI의 Kimi K2.5를 기반 모델로 명확히 드러내고 있었습니다. 모델 이름 하나를 바꾸지 않은 채로 서비스가 올라갔던 것입니다.
논란이 확산되자 Cursor 개발자 교육 부문 VP Lee Robinson이 직접 나섰습니다. “맞습니다, Composer 2는 오픈소스 베이스에서 출발했습니다”라고 인정했고, 최종 모델에 투입된 컴퓨팅의 약 4분의 1만 베이스 모델(Kimi K2.5)에서 왔고 나머지 4분의 3은 Cursor의 자체 학습 과정에 투입됐다고 설명했습니다. (출처: @leerob on X, 2026.03.20)
Kimi 공식 계정도 X에서 이를 확인했습니다. “Fireworks AI와의 승인된 상업적 파트너십을 통해 Kimi를 활용했다”는 내용입니다. Cursor 공동창업자 Aman Sanger는 “처음부터 블로그에 Kimi 베이스를 언급하지 않은 건 실수였습니다. 다음 모델에서는 바로잡겠습니다”라고 공개적으로 인정했습니다. (출처: @amanrsanger on X, 2026.03.20 / TechCrunch, 2026.03.22)
3배 비용에 1% 개선, 직접 계산해봤습니다
여기서 실제로 흥미로운 수치가 나옵니다. Reddit r/cursor의 한 개발자가 지적한 내용인데, SWE-bench Verified 기준으로 Composer 2는 Kimi K2.5 대비 약 1% 개선에 그쳤습니다. 그런데 컴퓨팅 비용은 약 3배 더 들었다는 분석입니다. (출처: r/cursor 스레드, 2026.03.20)
📊 가격 직접 비교 (API 기준, 2026.03.26 현재)
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) |
|---|---|---|
| Composer 2 (Standard) | $0.50 | $2.50 |
| Composer 2 Fast (기본값) | $1.50 | $7.50 |
| Kimi K2.5 (Moonshot 공식) | $0.60 | $3.00 |
| Claude Opus 4.6 | $5.00 | $25.00 |
| GPT-5.4 (short context) | $2.50 | $15.00 |
출처: cursor.com/docs/models-and-pricing / eesel.ai (2026.02.05) / the-decoder.com (2026.03.21) — Kimi K2.5 공식 가격은 moonshot.cn/pricing 기준
Standard 버전 기준으로는 Composer 2($0.50 입력)가 Kimi K2.5($0.60 입력)보다 오히려 저렴합니다. 그러나 실제로 Cursor 제품에서 기본값으로 제공되는 건 Fast 버전($1.50 입력, $7.50 출력)이고, 이 가격은 Kimi K2.5의 2.5배 수준입니다. 베이스 모델의 후속 버전을 쓰는 셈인데 가격은 더 높습니다.
다만 이 수치만으로 단순 비교하기는 어렵습니다. Cursor 환경 안에서는 컨텍스트 관리, 멀티파일 에이전트 오케스트레이션, 툴 콜 처리 등이 모델 호출 위에 얹혀 있기 때문입니다. 순수 API 가격 비교는 이 오케스트레이션 레이어의 가치를 제외한 수치입니다.
Cursor가 이 사실을 숨긴 진짜 이유
오픈소스 모델을 파인튜닝해서 사용하는 건 업계에서 흔한 일입니다. 문제는 그 사실을 공개하지 않았다는 점입니다. The Decoder는 이 부분을 명확하게 짚었습니다. Cursor가 Kimi K2.5 베이스를 공개했을 때 가장 불편한 질문을 스스로 불러올 수 있었기 때문입니다. (출처: the-decoder.com, 2026.03.21)
💡 오픈소스 파인튜닝이 오히려 업계의 불편한 진실을 드러냅니다
만약 Cursor가 처음부터 “Kimi K2.5를 베이스로 고도화했더니 프런티어급 성능이 나왔다”고 발표했다면, 이건 Cursor의 자랑이자 동시에 OpenAI·Anthropic에 대한 도전이 됐을 겁니다. 수조 원을 써서 훈련한 독점 모델이, 오픈소스 파인튜닝 결과물과 벤치마크 차이가 거의 없다면 — 독점 개발의 가치는 어디에 있을까요.
하지만 Cursor 입장에서 현실은 냉정합니다. 2026년 3월 현재 기업 가치 약 293억 달러(약 40조 원), 연간 반복 매출 20억 달러를 넘어섰지만, 자체 프런티어 모델을 처음부터 훈련할 역량을 Anthropic이나 OpenAI처럼 보유하지 못합니다. (출처: TechCrunch, 2026.03.02)
이번 발표에서 자체 모델이라는 뉘앙스를 강조한 건, 단순한 마케팅이 아니라 투자자와 기업 고객에게 “Cursor는 플랫폼을 넘어 모델 회사로 가고 있다”는 신호를 보내려 했기 때문일 가능성이 높습니다. 실제로 Bloomberg에 따르면 Cursor는 현재 약 500억 달러 기업 가치로 새 투자 라운드를 협상 중입니다. (출처: Bloomberg, 2026.03.12)
Cursor의 구조적 딜레마 — 경쟁사 모델로 경쟁사와 싸우는 상황
솔직히 말하면, 이번 논란에서 가장 흥미로운 건 Kimi 논란 자체가 아니라 Cursor가 처한 구조적 역설입니다. Cursor 플랫폼은 여전히 Claude Opus 4.6, GPT-5.4 같은 외부 모델을 지원합니다. 즉 Cursor는 자신과 직접 경쟁하는 회사들의 기술을 빌려다 그 회사들과 경쟁하고 있습니다.
📌 구독 비용과 실제 컴퓨팅 비용 사이의 간격
The Decoder의 보도에 따르면, Cursor는 Anthropic의 Claude Code 구독($200/월)이 실제로는 약 $5,000 상당의 컴퓨팅을 소모한다고 내부적으로 추산합니다. Anthropic이 Claude Code에 대규모 보조금을 태우는 셈인데, 서드파티로 Claude API를 쓰는 Cursor는 그 보조금을 받지 못합니다. (출처: the-decoder.com, 2026.03.21)
수치로 보면 이렇습니다. Cursor가 사용자에게 Claude Opus 4.6을 제공할 때, API 비용으로 입력 100만 토큰당 $5.00를 Anthropic에 냅니다. 그런데 Anthropic 자사 서비스인 Claude Code는 $200/월에 훨씬 넉넉하게 씁니다. 이 비용 차이가 구조적으로 누적될수록, Cursor의 소비자 구독 마진은 압박을 받습니다. 실제로 The Decoder는 Cursor의 소비자 구독이 이미 마이너스 마진 구조라고 전했습니다.
Composer 2는 이 딜레마를 해소하기 위한 첫 번째 시도입니다. 자체 모델을 가지면 외부 API 비용 의존도를 낮출 수 있고, 장기적으로는 모델 제공자가 아닌 플랫폼+모델 복합 사업자로 자리를 잡을 수 있습니다. Kimi K2.5를 베이스로 삼은 것도 이 맥락에서 보면 사실 꽤 합리적인 선택입니다.
Composer 2를 지금 써야 하는지, 솔직한 판단
기능 논란과 가격 구조를 다 들여다본 뒤 현실적으로 정리하면 이렇습니다. Composer 2는 Cursor 환경 안에서 일하는 사람에게 꽤 좋은 선택이 될 수 있습니다. Cursor 공식 문서에 따르면 장기 수평 코딩 작업에 최적화된 자체 요약(self-summarization) 방식으로 훈련됐고, 툴 호출·파일 편집·터미널 작업에 특화되어 있습니다. (출처: cursor.com/docs/models/cursor-composer-2)
이런 상황이라면 Composer 2가 맞습니다
- Cursor 개인 플랜($20/월)을 이미 쓰고 있고, Composer 풀에서 충분한 사용량이 포함된 경우 — 추가 API 비용 없이 씁니다.
- 여러 파일에 걸친 긴 리팩토링 작업이 주된 사용 패턴인 경우 — Cursor 오케스트레이션과 맞물려 있을 때 효과가 커집니다.
- Claude나 GPT 대비 속도를 우선시하는 경우 — Fast 버전은 실제 반응 속도가 빠른 편입니다.
반면 이런 상황에서는 다시 생각해볼 필요가 있습니다
- API 기준으로 순수 모델 성능이 목적이라면, Claude Opus 4.6은 SWE-bench Multilingual에서 77.8로 Composer 2(73.7)보다 높습니다.
- Cursor 외부 환경(OpenCode, Zed, VS Code 등)에서 쓸 계획이라면 Composer 2는 Cursor 전용으로 훈련됐기 때문에 이점이 줄어듭니다.
- 비용 최적화가 최우선이라면, Kimi K2.5를 Moonshot 공식 API로 직접 쓰는 것이 단순 API 비용 기준으로는 더 쌀 수 있습니다.
이 부분이 좀 아쉬웠습니다. Cursor가 처음부터 “Kimi K2.5를 베이스로 우리 환경에 최적화했다”고 발표했다면 오히려 더 설득력 있는 스토리가 됐을 겁니다. 투명성보다 독점 모델 이미지를 선택했다가 역풍을 맞은 케이스로 기억될 가능성이 큽니다.
Q&A
Q1. Composer 2가 Kimi K2.5 기반이라면, 직접 Kimi를 쓰는 게 더 낫지 않나요?
순수 API 가격만 보면 Kimi K2.5 직접 사용이 비용면에서 경쟁적입니다. 그러나 Cursor 환경에서 Composer 2를 쓰면 컨텍스트 관리, 멀티파일 에이전트 오케스트레이션이 함께 작동합니다. Cursor 개인 플랜 내 Composer 사용량 풀에 포함된 경우라면 추가 비용도 없습니다. 어떤 환경에서 주로 일하느냐에 따라 판단이 달라집니다.
Q2. Cursor의 이번 행동이 라이선스 위반은 아닌가요?
Kimi K2.5는 오픈소스 모델이며, Cursor는 Fireworks AI와의 승인된 상업적 파트너십을 통해 활용했습니다. Kimi 공식 계정도 이를 공개적으로 확인했습니다. 라이선스 위반이 아니라 투명성 부재가 문제였습니다.
Q3. Composer 2 Fast와 Standard 중 어떤 걸 써야 하나요?
공식 문서에 따르면 두 버전은 같은 지능(Same intelligence)을 제공하며 Fast가 속도를 높인 대신 가격이 3배 높습니다. 대화형 코딩 작업에는 Fast가 기본값이고, API 비용을 직접 부담하는 팀·기업 플랜이라면 Standard도 고려해볼 만합니다.
Q4. SWE-bench에서 Composer 2가 Kimi K2.5보다 1%밖에 개선 안 됐다는 게 맞나요?
SWE-bench Verified 기준 비교에서 그런 분석이 나왔습니다. 다만 Cursor의 Lee Robinson VP는 SWE-bench Verified가 실제 사용 환경을 대변하지 않는다고 반박했고, NextJS Evals 등 다른 벤치마크를 제시했습니다. SWE-bench Multilingual에서는 Composer 2가 73.7로 Kimi K2.5와 다른 지표를 보입니다. 벤치마크 선택에 따라 해석이 달라질 수 있습니다.
Q5. Cursor가 앞으로도 오픈소스 모델을 베이스로 쓸 가능성이 있나요?
Aman Sanger는 “다음 모델에서는 베이스를 명시하겠다”고 했는데, 이는 다음 모델도 유사한 방식으로 개발될 수 있음을 시사합니다. 자체 프런티어 모델을 처음부터 훈련하는 데 수조 원 규모의 컴퓨팅이 필요한 만큼, 오픈소스 기반 파인튜닝 전략이 단기적으로는 현실적인 선택지입니다.
마치며
Composer 2 논란에서 가장 중요한 건 “Kimi를 썼느냐 안 썼느냐”가 아닙니다. 이번 사건은 AI 코딩 도구 시장이 지금 어떤 구조 위에 서 있는지를 선명하게 드러냅니다. 프런티어 모델을 자체 훈련할 수 있는 곳은 극소수입니다. 나머지 모두는 오픈소스 모델을 파인튜닝하거나, 아니면 그 극소수에게 API 비용을 내면서 그들과 경쟁합니다.
Cursor가 만약 처음부터 “오픈소스를 베이스로, 우리 환경에 최적화했다”고 발표했다면 오히려 더 강력한 메시지가 됐을 겁니다. 수십억 달러짜리 독점 모델과 벤치마크가 엇비슷하다는 것 자체가 오픈소스 생태계의 저력을 증명하는 사례니까요. 숨기려다 역풍을 맞은 것은 아쉽습니다.
Cursor Composer 2 자체는 쓸 만한 모델입니다. 가격도, 성능도 경쟁력이 있습니다. 다만 그 모델이 어디서 왔는지, 왜 그렇게 만들어졌는지를 알고 쓰면 훨씬 합리적인 선택을 할 수 있습니다.
본 포스팅 참고 자료
- Cursor 공식 블로그 — Composer 2 발표 (cursor.com/ko/blog/composer-2)
- Cursor 공식 문서 — Composer 2 모델 스펙 (cursor.com/docs/models/cursor-composer-2)
- TechCrunch — Cursor admits its new coding model was built on top of Moonshot AI’s Kimi (techcrunch.com, 2026.03.22)
- The Decoder — Cursor quietly built its new coding model on top of Kimi K2.5 (the-decoder.com, 2026.03.21)
- Moonshot AI 공식 가격 문서 (platform.moonshot.ai)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 가격 및 수치는 2026.03.26 기준이며, 공식 채널에서 최신 정보를 확인하시기 바랍니다.











댓글 남기기