Cursor Composer 2, 자체 모델이라더니 3가지가 달랐습니다

Published on

2026년 3월 23일

2026.03.19 기준
Composer 2 v1.0 기준

Cursor Composer 2, 자체 모델이라더니 3가지가 달랐습니다

2026년 3월 19일, Cursor가 공식 블로그에서 Composer 2를 “자사 자체 개발 모델”이라고 발표했습니다. 그런데 출시 24시간 만에 개발자 한 명이 API 응답에서 모델 ID를 들여다봤고, 거기서 ‘Kimi K2.5’라는 이름이 나왔습니다. 벤치마크 수치는 인상적이고, 가격도 싸다고 했는데, 그 이면에 뭐가 있었는지 공식 문서와 실제 수치로 정리했습니다.

61.3

CursorBench 점수

$0.50

입력 100만 토큰당

38.4%

전작 대비 성능 향상

벤치마크 수치, 전작과 얼마나 차이 나는지 직접 봤습니다

Cursor 공식 블로그(2026.03.19)에서 공개한 CursorBench 점수를 그대로 옮기면 이렇습니다. (출처: cursor.com/blog/composer-2)

모델	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
Composer 2	61.3	61.7	73.7
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

CursorBench 기준으로 Composer 2(61.3)는 Composer 1.5(44.2) 대비 38.4% 올랐습니다. 숫자만 보면 Composer 1에서 2까지 1년도 안 되는 기간에 61%가 넘게 뛴 셈입니다. 실제 코딩 작업에서 이 폭의 차이가 그대로 느껴진다면 상당한 변화입니다.

그런데 여기서 한 가지 짚어야 할 게 있습니다. CursorBench는 Cursor 자사 내부 코드베이스에서 실제 개발자 세션을 뽑아 만든 벤치마크입니다. 공개 레포지터리 기반인 SWE-bench와 달리, 외부 연구자가 재현하거나 교차 검증하기 어렵습니다. Cursor 공식 문서에서도 “공개 벤치마크는 현재 프런티어 수준에서 모델 간 차별화가 어렵다”고 직접 설명하고 있습니다. (출처: cursor.com/blog/cursorbench)

💡 공식 발표문과 벤치마크 설계 문서를 같이 놓고 보니 이런 차이가 보였습니다. CursorBench-3 태스크 크기는 초기 버전 대비 약 2배로 늘었고, SWE-bench Verified보다 수정 라인 수 기준으로 실질적으로 더 복잡한 작업을 측정합니다. 자사 벤치마크라서 신뢰성에 의문을 가질 수 있지만, 오히려 공개 벤치마크보다 실제 개발자 경험에 가깝게 설계했다는 점은 인정할 만합니다.

▲ 목차로 돌아가기

모델 ID에서 나온 이름 — ‘Kimi K2.5’

발표 다음 날인 3월 20일, 개발자 @fynnso가 Cursor의 API 응답을 디버깅하다가 모델 식별자를 발견했습니다. 그 값은 kimi-k2p5-rl-0317-s515-fast였습니다. 해당 트윗은 444,000뷰를 넘겼습니다. (출처: Hacker News, news.ycombinator.com/item?id=47452404, 2026.03.21)

Moonshot AI(중국의 AI 스타트업, Kimi 개발사)의 사전학습 책임자 율룬 두는 토크나이저가 동일하다는 사실을 확인하고, Cursor가 라이센스 요건을 준수했는지 의문을 제기했습니다. Cursor 공식 블로그는 “지속적 사전학습(Continued Pretraining)과 강화학습(RL)을 통해 성능을 끌어올렸다”고만 설명했고, Kimi K2.5에 대한 언급은 없었습니다.

💡 Hacker News 스레드에서 나온 맥락 하나가 흥미롭습니다. “Composer 1도 Qwen 기반이었다”는 주장이 있고, 실제로 Cursor 공식 문서는 Composer 2의 기반이 된 베이스 모델에 대해 아직 공식 답변을 내놓지 않은 상태입니다. 오픈웨이트 모델을 기반으로 RL fine-tuning을 적용하는 방식은 엔지니어링 관점에서 상당히 유효한 접근이지만, “자체 모델”이라는 표현과는 일정한 간극이 있습니다.

▲ 목차로 돌아가기

라이센스 조건, Cursor가 조용한 이유가 있습니다

Kimi K2.5는 수정 MIT 라이센스로 공개되어 있습니다. 핵심 조건은 이겁니다. “월간 활성 사용자(MAU) 1억 명 이상이거나 월 수익 2천만 달러(USD) 이상인 상업 제품에서 본 소프트웨어를 사용하면, 제품 UI에 ‘Kimi K2.5’를 눈에 띄게 표시해야 한다.” (출처: Kimi K2.5 라이센스 원문, Hacker News 스레드 인용 원문 확인)

그런데 Cursor의 ARR은 2026년 2월 기준 약 20억 달러(약 $2B) 수준으로 보고됩니다. 월로 환산하면 약 1억 6,700만 달러 수준으로, 라이센스 조건인 월 2천만 달러 기준을 훨씬 넘습니다. 단순 계산만으로도 UI 내 표시 의무가 발생할 수 있는 조건입니다.

Cursor는 Composer를 자사 추론 인프라 파트너인 Fireworks를 통해 서빙한다고 밝혔습니다. 일부에서는 “MIT 라이센스는 GPL처럼 바이럴하지 않기 때문에, Fireworks가 서빙하면 Cursor 제품 UI에 표시 의무가 없을 수 있다”는 해석도 나옵니다. 법적 결론은 아직 나오지 않았고, Cursor 측은 이 혐의에 공식 답변을 내놓지 않은 상태입니다. (출처: Phemex News, 2026.03.21)

▲ 목차로 돌아가기

Compaction RL — 진짜 Cursor가 만든 것은 이겁니다

라이센스 논란과 별개로, Cursor가 Composer 2에서 실제로 집중한 기술은 따로 있습니다. 이름은 Compaction-in-the-Loop RL입니다. 기존 AI 코딩 에이전트의 가장 큰 약점 중 하나는 긴 작업 중간에 컨텍스트 창이 꽉 차면 과거 맥락을 잃는다는 것이었습니다. 외부 요약 프롬프트로 처리하면 중요한 변수명이나 이전 버그 수정 내용이 지워지는 일이 잦았습니다.

Cursor의 접근은 달랐습니다. 요약 작업을 외부 처리가 아니라 RL 트레이닝 루프 안에 직접 집어넣었습니다. 모델이 컨텍스트 한계에 도달하면 스스로 압축 요약을 생성하고, 그 요약이 이후 작업 성공으로 이어지면 보상을 받는 구조입니다. 공식 발표에 따르면 이 방식이 기존 상태 대비 압축 오류를 50% 줄였고, 일반 프롬프트 기반 요약보다 토큰 효율이 약 5배 높았습니다. (출처: Cursor 공식 블로그, cursor.com/blog/composer-2, 2026.03.19)

수백 개 액션이 연속되는 긴 작업에서 초반 계획을 잃지 않는다는 것, 실제로 대규모 리팩터링 작업에서 가장 먼저 체감할 수 있는 차이입니다.

💡 공식 발표문과 실제 기술 구조를 같이 놓고 보니 이런 차이가 보였습니다. Cursor가 강조한 “자체 모델”의 실질적 기여는 베이스 모델 개발이 아니라 RL 파인튜닝과 Compaction 기법에 있습니다. 이건 어시스턴트 성능 자체보다 장기 코딩 작업에서의 집중력 유지에 가깝습니다. 짧은 요청 중심으로 쓰는 사람에게는 전작과 차이가 거의 없을 수 있습니다.

▲ 목차로 돌아가기

요금 구조: Standard vs Fast, 실제 차이는 이렇습니다

Composer 2는 두 가지 가격 옵션으로 제공됩니다. Standard 버전은 입력 토큰 100만 개당 $0.50, 출력 100만 개당 $2.50입니다. Fast 버전은 동일한 성능에 입력 $1.50/M, 출력 $7.50/M으로 3배 비쌉니다. Cursor는 Fast를 기본값으로 설정했습니다. (출처: cursor.com/blog/composer-2)

이 구조에서 주목할 점이 있습니다. 공식 문서 각주에 따르면, Fast 버전 TPS(토큰 생성 속도)는 2026년 3월 18일 Cursor 기준으로 Composer GPT 대비 Anthropic 15% 우위라고 나옵니다. 단, TPS는 인프라 상황에 따라 달라질 수 있고, Anthropic 공급 측 상황이 바뀌면 수치도 달라집니다. Cursor가 공식적으로 이 이유를 별도로 밝히지 않은 부분입니다. (출처: cursor.com/blog/composer-2 각주 2)

버전	입력 (1M 토큰)	출력 (1M 토큰)	기본 설정
Standard	$0.50	$2.50	—
Fast	$1.50	$7.50	✓ 기본값

기본값이 Fast로 설정되어 있다는 건, 구독 사용량 풀을 더 빠르게 소모한다는 뜻입니다. Pro 플랜 $20에 포함된 Composer 풀을 최대로 활용하려면, 속도가 크게 중요하지 않은 배치 작업이나 긴 리팩터링에서는 Standard로 전환하는 게 더 유리합니다.

▲ 목차로 돌아가기

Pro $20 플랜에서 쓸 수 있는 조건 따로 있습니다

Cursor 요금제 문서를 보면, Composer 2는 Auto와 함께 별도의 사용량 풀(Auto + Composer Pool)을 씁니다. API 모델(GPT-5, Claude Opus 등)과 다른 풀입니다. Pro 플랜 기준으로 API 풀에 월 $20가 포함되고, Auto + Composer 풀은 “넉넉하게 포함”이라는 표현만 있고 정확한 수치는 공개되지 않았습니다. (출처: cursor.com/docs/models-and-pricing)

공식 문서 가이드에 따르면 “일일 에이전트 사용자”는 월 $60~$100 범위에 들고, “멀티 에이전트·자동화 파워 유저”는 $200 이상이 됩니다. Composer 2를 하루 종일 쓴다면 Pro $20 플랜 하나로는 부족할 가능성이 있습니다. 가격 대비 체감 효율이 좋은 사용 패턴은 복잡한 장기 작업에서 Composer 2, 빠른 단답성 작업에서는 Auto를 혼용하는 방식입니다.

2026년 3월 기준, Cursor는 JetBrains IDE 지원(ACP 프로토콜), Automations(Slack·GitHub·Linear 트리거 기반 에이전트), Marketplace 플러그인 30개 이상도 함께 업데이트했습니다. Composer 2 단독으로 따지기보다 이 전체 생태계 변화의 한 파트로 봐야 합니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q1. Composer 2는 완전히 Cursor가 만든 모델인가요?

API 응답에서 확인된 모델 ID(kimi-k2p5-rl-0317-s515-fast)는 Kimi K2.5 기반임을 시사합니다. Cursor는 “지속적 사전학습과 강화학습으로 훈련했다”고 발표했지만 베이스 모델에 대해서는 공식 답변을 내놓지 않은 상태입니다.

Q2. Kimi K2.5 라이센스 위반이 확정된 건가요?

아직 법적으로 확정된 사안이 아닙니다. Moonshot AI 측이 라이센스 준수 여부에 의문을 제기했고, 일부 해석에서는 Fireworks 같은 제3자 추론 인프라를 통하면 UI 표시 의무가 Cursor에 직접 적용되지 않을 수 있다는 시각도 있습니다. 공식 결론은 나오지 않았습니다.

Q3. Pro $20 플랜으로 Composer 2를 매일 쓸 수 있나요?

공식 문서 기준으로 “일일 에이전트 사용자”는 통상 $60~$100 범위의 사용량이 발생합니다. $20 플랜의 Auto+Composer 풀 정확한 한도는 공개되지 않았지만, 매일 장시간 Composer 2만 쓰면 초과할 가능성이 있습니다. Auto와 혼용하는 패턴을 권장합니다.

Q4. Compaction RL이 짧은 작업에도 도움이 되나요?

Compaction-in-the-Loop RL은 장기 컨텍스트가 소진되는 상황에 특화된 기술입니다. 단발성 질문이나 짧은 함수 수정 같은 작업에서는 전작 대비 차이가 크지 않을 수 있습니다. 수백 액션이 연속되는 긴 리팩터링이나 멀티파일 작업에서 체감 차이가 더 큽니다.

Q5. Fast 버전이 기본값인데 Standard로 바꿀 수 있나요?

Cursor 설정에서 모델 선택 시 Composer 2 Standard와 Fast를 구분해서 선택할 수 있습니다. 속도보다 사용량 절약이 우선이면 Standard로 전환하는 게 비용 면에서 유리합니다. 두 버전의 성능(코딩 품질)은 동일하다고 공식 문서에서 밝히고 있습니다.

▲ 목차로 돌아가기

마치며

Cursor Composer 2는 수치만 놓고 보면 인상적인 업데이트입니다. CursorBench 기준 38.4% 향상, 출시 5개월 만에 세 번째 세대, $0.50/M 입력이라는 가격은 실질적으로 경쟁력이 있습니다.

다만 이 업데이트를 “Cursor가 Anthropic이나 OpenAI를 넘어섰다”는 식으로 읽으면 오해가 생깁니다. 베이스 모델이 자사 기술인지에 대해 Cursor는 아직 공개하지 않았고, 라이센스 문제는 진행 중이며, CursorBench는 재현 불가능한 자사 벤치마크입니다. Compaction RL이라는 진짜 기술 기여가 있지만, 그 효과는 장기 코딩 세션에서 한정적으로 체감됩니다.

솔직히 말하면, 이번 Composer 2 발표에서 가장 의미 있는 것은 모델 자체보다 Cursor가 이 방식을 반복할 수 있다는 사실입니다. 오픈웨이트 기반 모델에 자사 RL을 얹어서 저렴하게 제공하는 패턴, 앞으로도 계속 나올 것입니다. 그 패턴의 지속 가능성이 진짜 관전 포인트입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Cursor 공식 블로그 — Composer 2 발표 (cursor.com/blog/composer-2)
Cursor 공식 블로그 — CursorBench 설명 (cursor.com/blog/cursorbench)
Cursor 공식 문서 — 요금 및 사용량 구조 (cursor.com/docs/models-and-pricing)
Hacker News 스레드 — Kimi K2.5 라이센스 논의 (news.ycombinator.com, 2026.03.21)
Phemex News — Moonshot AI 라이센스 혐의 (phemex.com, 2026.03.21)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 라이센스 분쟁 관련 내용은 2026.03.22 기준으로 수집한 공개 정보이며, 법적 판단이나 투자 조언이 아닙니다. 최신 정보는 Cursor 공식 채널에서 직접 확인하시기 바랍니다.

AI코딩도구, AntigravityVSCursor, Composer2, CursorBench, KimiK2

Cursor Composer 2, 자체 모델이라더니 3가지가 달랐습니다

Cursor Composer 2, 자체 모델이라더니 3가지가 달랐습니다

벤치마크 수치, 전작과 얼마나 차이 나는지 직접 봤습니다

모델 ID에서 나온 이름 — ‘Kimi K2.5’

라이센스 조건, Cursor가 조용한 이유가 있습니다

Compaction RL — 진짜 Cursor가 만든 것은 이겁니다

요금 구조: Standard vs Fast, 실제 차이는 이렇습니다

Pro $20 플랜에서 쓸 수 있는 조건 따로 있습니다

자주 나오는 질문 5가지

마치며

본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

Cursor Composer 2, 자체 모델이라더니 3가지가 달랐습니다

벤치마크 수치, 전작과 얼마나 차이 나는지 직접 봤습니다

모델 ID에서 나온 이름 — ‘Kimi K2.5’

라이센스 조건, Cursor가 조용한 이유가 있습니다

Compaction RL — 진짜 Cursor가 만든 것은 이겁니다

요금 구조: Standard vs Fast, 실제 차이는 이렇습니다

Pro $20 플랜에서 쓸 수 있는 조건 따로 있습니다

자주 나오는 질문 5가지

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기