Cursor Composer 2 써봤더니 Kimi였습니다

Published on

in

Cursor Composer 2 써봤더니 Kimi였습니다

2026.03.30 기준 / Cursor Composer 2 (2026.03.19 출시)

Cursor Composer 2 써봤더니 Kimi였습니다

3월 19일 Cursor가 자사 코딩 모델 Composer 2를 공개했습니다. 발표 당일 가장 많이 공유된 문장은 “Claude Opus 4.6을 이기고 가격은 10분의 1”이었습니다. 그런데 이틀 뒤 더 많이 퍼진 문장이 있습니다. “알고 보니 Kimi 위에 올린 거였다.” 둘 다 사실이고, 둘 다 정확히는 반쪽입니다.

Terminal-Bench 2.0
61.7
Claude Opus 4.6(58.0) 초과
입력 토큰 단가
$0.50
Claude Opus 4.6($5.00) 대비
기반 모델
Kimi K2.5
Moonshot AI 오픈소스

성능 수치, 직접 읽어봤습니다

Cursor가 3월 19일 공개한 공식 발표문에는 세 가지 벤치마크 수치가 들어 있습니다. CursorBench 61.3, Terminal-Bench 2.0 61.7, SWE-bench Multilingual 73.7입니다. (출처: Cursor 공식 블로그, 2026.03.19)

모델 CursorBench Terminal-Bench 2.0 SWE-bench Multi
Composer 2 61.3 61.7 73.7
Composer 1.5 44.2 47.9 65.9
Composer 1 38.0 40.0 56.9
Claude Opus 4.6 58.0
GPT-5.4 75.1

Composer 1에서 2까지 오면서 CursorBench 점수가 38.0 → 61.3으로 61% 뛰었습니다. 전작 대비 향상 폭이 크긴 합니다. Terminal-Bench 2.0 기준으로는 Claude Opus 4.6(58.0)을 넘겼지만, GPT-5.4(75.1)와는 13점 넘는 격차가 있습니다. “Claude를 이겼다”는 말은 맞지만 “모든 모델 중 최고”라는 뜻은 아닙니다.

💡 공식 발표문과 실제 리더보드를 같이 놓고 보면 이런 차이가 보입니다 — Cursor는 Terminal-Bench 2.0에서 GPT-5.4 점수를 빠뜨렸습니다. 발표 자료에는 Claude Opus 4.6과의 비교만 강조됐고, 더 앞서는 모델과의 13점 격차는 각주 수준으로 처리됐습니다.

Composer 2 Fast 버전(기본값)은 표준 버전과 동일한 지능을 가지면서 속도가 더 빠릅니다. 단 요금은 출력 토큰 기준 100만 개당 $7.50으로 표준($2.50)보다 높습니다. (출처: Cursor 공식 블로그, 2026.03.19) 자동으로 Fast가 기본값으로 적용된다는 점은 요금 계산할 때 주의할 부분입니다.

▲ 목차로 돌아가기

요금 구조가 생각보다 복잡합니다

Composer 2의 입력 토큰 단가는 $0.50/M, 출력은 $2.50/M입니다. Claude Opus 4.6은 $5.00/$25.00이니 입력 기준 정확히 10분의 1입니다. (출처: Cursor 모델 및 요금 페이지, 2026.03) 수치 자체는 맞습니다.

그런데 Cursor 요금제를 쓸 때 이 수치가 바로 내 청구서에 반영되진 않습니다. Cursor Pro($20/월) 플랜에는 “Auto + Composer 풀”과 “API 풀” 두 가지가 존재합니다. Composer 2를 Auto 또는 Composer 모드로 쓰면 전자의 풀에서 차감되고, 특정 모델을 명시적으로 선택하면 API 풀에서 차감됩니다.

Cursor Pro 플랜 사용량 구조 (2026.03 기준)

  • Auto + Composer 풀: 월정액에 포함, 일상적 에이전트 코딩 대상
  • API 풀: 월 $20 기본 포함, 초과 시 종량제
  • Max Mode: API 단가 + 20% 할증 추가

출처: cursor.com/ko/docs/models-and-pricing

매일 에이전트를 집중적으로 쓰는 경우 공식 문서 기준으로 월 $60~$100 수준이 된다고 나와 있습니다. 파워 유저는 $200 이상도 가능합니다. “$0.50/M이니까 엄청 싸겠지”라고 단순 계산하면 실제 청구 금액에서 놀랄 수 있습니다.

반대로 개인이 가끔 사용하는 수준이라면 월 $20 Pro 플랜의 포함 사용량 안에서 Composer 2를 넉넉히 쓸 수 있습니다. 사용 패턴에 따라 체감 비용 차이가 큽니다.

⚠️ 주의: Fast 버전이 기본값으로 설정됩니다. 표준 버전($2.50/M)이 아닌 Fast 버전($7.50/M 출력)이 자동 적용되니, 비용 최적화를 원한다면 모델 설정에서 직접 Standard로 전환해야 합니다. (출처: Cursor 공식 블로그, 2026.03.19)

▲ 목차로 돌아가기

Kimi 기반인 게 왜 문제가 됐을까요

발표 다음 날, 개발자 커뮤니티에서 Composer 2의 API 응답에서 Moonshot AI의 Kimi K2.5 모델 ID가 발견됐습니다. Kimi K2.5는 베이징 AI 기업 Moonshot AI가 오픈소스로 공개한 1조 파라미터 규모의 Mixture-of-Experts 모델입니다. 코딩과 추론에 특화돼 있습니다.

Cursor 측은 3월 22일 Kimi K2.5를 기반 모델로 사용했고, 전체 컴퓨팅의 약 75%를 자체 지속 사전학습과 강화학습에 투입했다고 밝혔습니다. 파트너십은 Fireworks AI를 통한 정식 상업적 계약이었습니다. 라이선스 위반 여부는 공식적으로 결론이 나지 않은 상태입니다.

💡 Cursor의 발표문과 실제 기술 구조를 교차해 보면 이런 그림이 나옵니다

발표문은 “저희의 첫 지속 사전학습”이라고 표현했습니다. 맞는 말입니다. 하지만 그 사전학습이 어떤 모델 위에서 시작됐는지는 명시하지 않았습니다. 기술적으로 거짓말은 아니지만, 독자가 ‘처음부터 직접 만든 모델’로 이해할 여지를 남겨뒀습니다. Cursor 공동창업자는 이후 “베이스 모델을 언급하지 않은 것은 실수였다”고 직접 인정하고, 앞으로는 공개하겠다고 했습니다.

커뮤니티에서 화가 난 이유는 Kimi를 썼다는 사실 자체가 아니었습니다. 오픈소스 모델을 기반으로 제품을 만드는 건 업계 표준에 가깝습니다. 문제는 $20~$200/월을 내는 사용자들이 “Cursor가 독자적으로 구축한 모델”로 이해하게끔 발표가 이루어졌다는 점이었습니다.

오픈소스 AI 라이선스의 귀속 요건은 아직 법적으로 정리되지 않은 영역입니다. 전통 소프트웨어와 달리 모델을 서버에서 서비스로 제공하면 배포 트리거가 발동되지 않을 수 있습니다. Cursor가 법적으로 위반했는지는 공식 답변이 나오지 않았습니다. 이 자체가 AI 산업 전반의 미해결 과제입니다.

▲ 목차로 돌아가기

자체 벤치마크라는 점, 그냥 넘기기 어렵습니다

Cursor가 발표에서 가장 강조한 수치는 CursorBench 점수입니다. 그런데 CursorBench는 Cursor 엔지니어링 팀의 실제 세션을 바탕으로 만들어진 내부 평가 도구입니다. (출처: cursor.com/ko/blog/cursorbench, 2026.03)

💡 Cursor 공식 문서가 공개 벤치마크의 한계를 직접 인정합니다

Cursor는 공개 벤치마크인 SWE-bench 등이 “공개 저장소에서 과제를 가져오기 때문에 모델 학습 데이터에 포함되어 점수가 부풀려질 수 있다”고 직접 지적했습니다. OpenAI조차 이런 이유로 SWE-bench Verified 점수 보고를 중단했다는 사실도 명시했습니다. 자기 스스로 공개 벤치마크의 신뢰성에 의문을 제기하면서, 동시에 자체 벤치마크에서 최고 점수를 내세우는 구조입니다. 두 주장을 동시에 받아들이려면 “CursorBench는 오염 걱정이 없다”는 전제가 필요한데, 그 전제도 Cursor 본인이 제시한 것입니다.

Reddit에서 가장 많이 공감을 받은 댓글은 정확히 이 지점을 짚었습니다. “자체 벤치마크를 만들어놓고 거기서 자신들이 높은 점수를 냈다는 게 의미 있는 건가요?” 공정한 비판입니다.

다만 Cursor의 반론도 일부는 타당합니다. CursorBench 과제가 실제 개발자 요청에서 나왔고, 모델 성능 순위가 온라인 사용자 만족도 지표와 일치한다고 밝히고 있습니다. 벤치마크 조작 여부보다는, 이 도구가 특정 사용 환경(Cursor 안의 에이전트 코딩)에 최적화돼 있다는 점을 인식하고 수치를 해석해야 한다는 게 솔직한 결론입니다.

▲ 목차로 돌아가기

실제 사용자 반응은 갈렸습니다

r/cursor 스레드에서 가장 긍정적인 평가는 “긴 작업에서 Composer 1.5보다 확실히 낫다”는 방향이었습니다. 수백 단계가 필요한 복잡한 구현에서 중간에 흐름이 끊기는 빈도가 줄었다는 후기가 여럿 있었습니다.

반면 부정적인 의견도 뚜렷했습니다. 코드 롤백(reversion) 버그가 3월 기준으로도 여전히 보고되고 있고, 간단한 작업에서는 Composer 1.5 대비 체감 차이가 없다는 평가도 많았습니다. 복잡도 낮은 반복 작업이 주된 작업이라면 업그레이드 효과를 피부로 느끼기 어려울 수 있습니다.

Cursor 공식 블로그에서 공개한 통계가 있습니다. 2025년 3월에는 탭 완성 사용자가 에이전트 사용자보다 2.5배 많았지만, 지금은 에이전트 사용자가 탭 사용자보다 2배 많습니다. (출처: Cursor 공식 블로그 ‘AI 소프트웨어 개발의 세 번째 시대’, 2026.02.26) 그 변화 속에서 Composer 2가 출시된 만큼, 에이전트 중심으로 이미 전환한 사용자라면 체감 이점이 더 클 가능성이 높습니다.

📊 Cursor 내부 통계 기준, 전체 머지 PR의 35%가 클라우드 에이전트 자동 생성 코드입니다. (출처: Cursor 공식 블로그, 2026.02.26) Composer 2는 이 “에이전트가 코드를 쓰는 비율”을 높이려는 방향의 연장선에 있습니다.

▲ 목차로 돌아가기

결국 이 모델, 지금 쓸 만할까요

솔직히 말하면, Composer 2는 “최고의 코딩 모델”이 아닙니다. Terminal-Bench 2.0 기준 GPT-5.4(75.1)보다 13점 낮습니다. 가장 어려운 코딩 태스크에서는 그 격차가 체감됩니다.

그런데 가격 계산을 해보면 그림이 달라집니다. 코딩 요청 한 건당 비용이 Claude Opus 4.6($0.80) 대비 Composer 2 Fast($약 0.08)로 10배 차이가 납니다. (출처: byteiota.com 분석, 2026.03, Cursor 공식 요금 기준 역산 추정) 하루 50건 기준으로 연간 약 $12,960 차이가 됩니다. 기업에서 개발자 5,000명이 전환하면 약 $6,480만을 절약할 수 있다는 계산이 나옵니다.

이 수치가 주는 메시지는 단순합니다. GPT-5.4가 절대적으로 필요한 극도로 복잡한 작업이 아니라면, Composer 2는 충분히 납득할 만한 성능을 훨씬 낮은 비용에 제공합니다. “가장 좋은 모델 하나를 골라 쓰는” 전략에서, 작업 난이도별로 모델을 달리 쓰는 전략으로 넘어가는 게 현실적인 방향입니다.

Composer 2가 유리한 상황 vs. 다른 모델이 나은 상황

✅ Composer 2 유리

  • 멀티파일 리팩토링
  • 장기 에이전트 작업
  • 비용 효율이 중요한 팀
  • Cursor 생태계 활용

⚠️ 다른 모델 고려

  • 최고 난이도 알고리즘
  • 터미널 집중 CLI 작업
  • GPT-5.4 대비 격차 큰 영역
  • Cursor 외 IDE 사용자

Kimi 기반이라는 사실이 성능에 대한 신뢰를 떨어뜨려야 하는지는 사람마다 다르게 받아들입니다. Kimi K2.5가 코딩 벤치마크에서 이미 검증된 모델이라는 점, Cursor가 그 위에 상당한 추가 학습을 올렸다는 점은 사실입니다. 그 위에 투명성 문제를 어떻게 가중하느냐는 각자 판단입니다.

▲ 목차로 돌아가기

Q&A

Q1. Composer 2는 기존 Cursor 요금제에 포함되나요, 추가 결제가 필요한가요?

Pro 플랜($20/월) 이상에서 Auto + Composer 풀에 포함됩니다. 별도 추가 결제 없이 일정 사용량까지 이용할 수 있습니다. 다만 집중적으로 에이전트를 쓰면 풀을 초과해 종량제 추가 과금이 발생합니다. Cursor 요금 페이지에서 사용량 기준을 직접 확인하는 게 정확합니다.

Q2. Kimi K2.5 기반이라면 오픈소스로 무료로 쓸 수 있지 않나요?

Kimi K2.5 원본 모델 웨이트는 오픈소스로 다운로드할 수 있습니다. 하지만 Cursor Composer 2는 그 위에 Cursor가 지속 사전학습과 강화학습을 추가한 별도 모델입니다. Cursor 제품 안에서 Composer 2를 쓰는 것과, Kimi K2.5를 직접 구동하는 것은 성능 면에서 다릅니다.

Q3. Composer 2 Standard와 Fast, 어떤 걸 써야 하나요?

지능 수준은 동일하고 속도 차이만 있습니다. Fast가 기본값으로 자동 설정되므로, 비용 최적화를 원한다면 Standard를 수동으로 선택해야 합니다. 출력 토큰 기준 Fast($7.50/M) vs Standard($2.50/M)로 3배 차이입니다. 실시간 응답이 중요한 작업엔 Fast, 비동기·배치 처리엔 Standard가 적합합니다.

Q4. CursorBench 점수를 공정한 벤치마크로 믿어도 되나요?

Cursor 내부 에이전트 코딩 환경에서의 성능을 평가하는 용도로는 의미 있습니다. 다만 Cursor 팀이 직접 설계하고 운영한다는 점에서 중립적이라고 보기 어렵습니다. 실제 사용하는 작업 유형이 CursorBench 과제와 비슷할수록 지표가 유의미하고, 그렇지 않을수록 참고 수준으로만 받아들이는 게 현실적입니다.

Q5. Cursor를 쓰지 않고 Composer 2를 사용할 방법이 있나요?

현재는 Cursor 에디터 또는 glass(초기 알파 인터페이스) 안에서만 이용 가능합니다. 2026년 3월 기준으로 Cursor는 JetBrains IDE에서도 ACP(Agent Client Protocol)를 통해 Cursor를 연결할 수 있게 됐습니다. 단, 이 경우도 Cursor 계정이 필요합니다.

▲ 목차로 돌아가기

마치며

Composer 2를 둘러싼 이야기는 두 겹입니다. 하나는 성능과 비용에 관한 이야기고, 다른 하나는 오픈소스 AI를 어떻게 다뤄야 하는지에 관한 이야기입니다.

성능 이야기부터 하면, Composer 2는 Claude Opus 4.6보다 특정 벤치마크에서 높은 점수를 냈고 가격은 10분의 1입니다. 이 부분은 사실이고, 에이전트 코딩을 집중적으로 쓰는 개발자에게 실질적인 의미가 있습니다. 다만 자체 벤치마크라는 점과 GPT-5.4와의 격차는 그대로 인지하고 쓸 필요가 있습니다.

두 번째 이야기가 좀 더 오래 남습니다. Moonshot AI가 오픈소스로 공개한 Kimi K2.5를 Cursor가 조용히 가져다 썼고, 그 사실을 발표 당일엔 밝히지 않았습니다. Cursor는 이미 공식 사과를 했고 앞으로는 공개하겠다고 했습니다. 하지만 이 사건은 AI 서비스 회사들이 오픈소스 모델을 얼마나 투명하게 활용하고 있는지에 대한 질문을 업계 전체로 던졌습니다. 이 부분에서 Cursor만 특별히 나쁜 건 아닙니다. 다만 Cursor가 가장 눈에 띄게 걸렸을 뿐입니다.

Composer 2를 쓸지 말지는 결국 자신의 작업 환경과 비용 감각에 달린 문제입니다. 단, 이 모델이 어디서 왔는지 알고 쓰는 것과 모르고 쓰는 건 다릅니다. 그 차이를 인식하는 것 자체가 지금 AI 코딩 도구를 잘 쓰는 방법 중 하나라고 생각합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Cursor 공식 블로그 — Composer 2 발표 (2026.03.19)
  2. Cursor 공식 블로그 — CursorBench 소개
  3. Cursor 공식 문서 — 모델 및 요금 안내
  4. Cursor 공식 블로그 — AI 소프트웨어 개발의 세 번째 시대 (2026.02.26)
  5. MindStudio — Cursor Composer 2 & Kimi K2.5 오픈소스 귀속 분석 (2026.03)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 수치 및 요금 정보는 2026년 3월 30일 기준으로 Cursor 공식 문서·블로그를 참고했습니다. Composer 2(2026.03.19 출시) 기준이며, 이후 업데이트에 따라 내용이 달라질 수 있습니다. 투자 또는 구매 결정은 공식 채널에서 최신 정보를 확인하세요.

댓글 남기기


최신 글

  • 청년월세지원 신청 2026, 임대차 서류 체크
    청년월세지원 신청 2026 기준으로 나이·거주 요건, 계약서와 이체 내역, 본인·원가구 소득 확인 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민취업지원제도 신청 2026, 구직촉진수당 체크
    국민취업지원제도 신청 2026 기준으로 유형과 자격, 월 소득과 재산, 구직활동 계획 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민연금 반환일시금 청구 2026, 수급 조건 확인
    국민연금 반환일시금 청구 2026 기준으로 10년 기준, 연령·국외이주 등, 신분·계좌·증빙 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 건강보험 환급금 조회 2026, 본인부담금 확인
    건강보험 환급금 조회 2026 기준으로 공식 화면 여부, 발생 사유, 본인 명의 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 주택청약 당첨 포기 2026, 재당첨 제한 체크
    주택청약 당첨 포기 2026 기준으로 주택 유형과 지역, 일정과 통장 영향, 사유와 소명 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 전입세대확인서 열람 2026, 계약 전 주소 확인
    전입세대확인서 열람 2026 기준으로 주소와 동·호수, 기존 전입 여부, 등기부·확정일자 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기