Cursor Composer 2, Kimi 기반이어도 괜찮은 딱 한 가지 조건

Published on

in

Cursor Composer 2, Kimi 기반이어도 괜찮은 딱 한 가지 조건

2026.03.19 출시 기준
Composer 2 / Fast 버전 기준
TECH

Cursor Composer 2, Kimi 기반이어도 괜찮은 딱 한 가지 조건

2026년 3월 19일, Cursor가 자체 코딩 모델 Composer 2를 공개했습니다. 발표 직후 “자체 개발 모델”이라는 홍보 문구가 나왔지만, 사흘 만에 실체가 드러났습니다. 중국 오픈소스 모델 Kimi K2.5를 베이스로 쓴 것이었습니다. 그런데 이 논란을 들여다보면, 정작 중요한 건 출처 문제가 아닙니다.

86%
Composer 1.5 대비 가격 인하폭
61.3
CursorBench 점수 (Opus 4.6은 58.2)
1/10
Claude Opus 4.6 대비 토큰 비용

논란의 시작 — Kimi K2.5가 뭔데 이렇게 난리인가

2026년 3월 19일, Cursor는 공식 블로그에 Composer 2 출시를 알리면서 “프런티어급 코딩 성능에 합리적인 요금”이라고 소개했습니다. 출시 발표문 어디에도 외부 베이스 모델에 대한 언급은 없었습니다. 그런데 불과 이틀 뒤, X(구 트위터)에서 한 개발자가 API 응답 헤더에서 Kimi 모델 ID를 발견했습니다. “적어도 모델 ID는 바꿔놓지”라는 한 마디와 함께 스크린샷이 퍼졌고, 실리콘밸리 개발자 커뮤니티가 순식간에 들썩였습니다.

Kimi K2.5는 중국 스타트업 Moonshot AI가 2026년 1월에 공개한 오픈소스 모델입니다. Alibaba와 HongShan(구 세콰이어 차이나)이 투자한 회사입니다. 수정된 MIT 라이선스로 배포돼 있는데, 이게 뒤에서 이야기할 함정의 시작입니다.

Cursor VP 리 로빈슨(Lee Robinson)은 사태가 터지자 공개 인정했습니다. “Composer 2는 오픈소스 베이스에서 출발했습니다. 최종 모델 컴퓨팅의 약 1/4만 베이스 모델에서 온 것이고, 나머지는 Cursor가 직접 훈련했습니다.” (출처: X/@leerob, 2026.03.21) 라이선스 문제에 대해서는 Fireworks AI의 호스팅 플랫폼을 통한 상업적 파트너십임을 강조했고, Kimi 측도 “승인된 파트너십”이라고 확인해줬습니다.

▲ 목차로 돌아가기

“자체 개발” 마케팅이 문제였던 이유

💡 공식 발표문과 실제 API 트래픽을 같이 놓고 보니 이런 차이가 보였습니다 — Cursor는 Composer 2를 소개하면서 단 한 번도 “Kimi”를 언급하지 않았습니다. 반면 Composer 1도 Qwen(중국 알리바바 오픈소스) 기반이었다는 사실이 Hacker News 스레드에서 개발자들에 의해 지적됐습니다. (출처: news.ycombinator.com, item #47452404, 2026.03.22) 패턴이 반복됐다는 점에서 이번 논란이 단순 실수가 아닌 구조적 문제라는 시각도 있습니다.

공동창업자 아만 상거(Aman Sanger)는 뒤늦게 “처음부터 Kimi 베이스를 블로그에 언급했어야 했습니다. 다음 모델부터는 고치겠습니다”라고 인정했습니다. (출처: X/@amanrsanger, 2026.03.21) 그런데 왜 처음부터 밝히지 않았을까요? The Decoder의 분석이 직격탄을 날렸습니다 — Anthropic, OpenAI처럼 수십억 달러를 자체 기반 모델 개발에 쏟는 경쟁사 앞에서, Cursor가 오픈소스를 베이스로 쓴다고 인정하면 “직접 프론티어 모델을 못 만드는 회사”라는 인식이 생길 수 있었기 때문입니다. (출처: The Decoder, 2026.03.21)

결국 기술 문제가 아니라 브랜딩 문제였습니다. Cursor의 진짜 강점은 기반 모델 개발이 아니라 코딩 에디터와 에이전트 워크플로우 통합에 있는데, 그걸 스스로 가리려고 했던 셈입니다.

▲ 목차로 돌아가기

가격표를 직접 비교해봤습니다 — 생각보다 차이가 큽니다

Cursor 공식 문서에 나온 수치를 직접 정리해봤습니다. 토큰 100만 개당 기준입니다.

모델 입력 (1M 토큰) 출력 (1M 토큰) 비고
Composer 2 Standard $0.50 $2.50 표준
Composer 2 Fast $1.50 $7.50 현재 기본값
Composer 1.5 (이전) $3.50 $17.50 단종
Claude Opus 4.6 $5.00 $25.00 Anthropic API 기준
GPT-5.4 $2.50~5.00 $15.00~22.50 컨텍스트 길이 따라 다름

출처: Cursor 공식 Docs(cursor.com/ko/docs/models-and-pricing), The Decoder(2026.03.21), VentureBeat(2026.03.19)

Composer 2 Standard 기준으로 Composer 1.5 대비 입력·출력 모두 86% 저렴합니다. Claude Opus 4.6과 비교하면 입력은 10분의 1 수준입니다. 이게 의미하는 건 간단합니다 — 에이전트 코딩처럼 수백 번의 도구 호출이 연속으로 일어나는 긴 작업일수록 비용 차이가 기하급수적으로 커집니다.

단, 팀·엔터프라이즈 플랜 사용자는 API 요금이 직접 청구됩니다. 개인 Pro 플랜($20/월)이나 Pro+($60/월) 구독자는 별도의 Composer 사용량 풀이 적용되기 때문에 토큰 요금을 직접 계산할 필요가 없습니다. (출처: cursor.com/ko/docs/models/cursor-composer-2)

▲ 목차로 돌아가기

벤치마크 숫자보다 먼저 봐야 할 게 있습니다

Cursor가 내세운 벤치마크 수치를 봅시다. CursorBench에서 Composer 2는 61.3점으로 Claude Opus 4.6(58.2점)을 앞섭니다. Terminal-Bench 2.0에서도 61.7점으로 Opus 4.6(58.0점)을 넘습니다. (출처: Cursor 공식 블로그, cursor.com/ko/blog/composer-2, 2026.03.19) 숫자만 보면 “싸고 좋은 모델”처럼 보입니다.

💡 공식 벤치마크 출처와 측정 조건을 함께 놓고 보니 이 부분이 눈에 걸렸습니다 — CursorBench는 Cursor가 직접 만들고 직접 돌린 내부 벤치마크입니다. Terminal-Bench 2.0은 제3자 기관(Laude Institute)이 운영하지만, Cursor는 자체 하니스(harness)와 세팅으로 돌렸습니다. Cursor 공식 문서 각주에도 “Terminal-Bench 결과는 에이전트·하니스·세팅에 따라 다르며 직접 비교가 안 된다”고 명시돼 있습니다. 같은 Terminal-Bench 2.0에서 Anthropic이 Claude Opus 4.6을 최적화 세팅으로 돌리면 65.4점이 나옵니다. Composer 2(61.7점)보다 높습니다.

GPT-5.4 Thinking은 Terminal-Bench 2.0에서 75.1점으로 Composer 2를 크게 앞섭니다. (출처: VentureBeat, 2026.03.19) “Opus 4.6을 이겼다”는 헤드라인은 사실이지만, 어떤 세팅에서, 어떤 에이전트 조건에서 측정했느냐에 따라 순위가 바뀝니다.

벤치마크를 무시하라는 게 아닙니다. 다만 Cursor 안에서 Composer 2를 쓸 때 유리한 환경으로 측정한 수치라는 점을 감안하고 볼 필요가 있습니다. Cursor 밖에서는 쓸 수도 없는 모델이기도 하고요.

▲ 목차로 돌아가기

Kimi 라이선스 조건, 규모가 커지면 오히려 발목 잡힙니다

수정된 MIT 라이선스에는 이런 조항이 있습니다

Kimi K2.5의 라이선스는 수정된 MIT입니다. 개인 개발자나 소규모 팀에겐 사실상 자유롭게 사용할 수 있습니다. 그런데 Hacker News 스레드에서 지적된 조항이 있습니다 — MAU(월간 활성 사용자) 1억 명 초과 또는 MRR(월 매출) 2,000만 달러 초과 시, 서비스 내에서 Kimi K2.5를 활용하고 있음을 눈에 띄게 표시해야 합니다. (출처: HackerNews #47452404, 2026.03.22) 이 기준을 넘으면 자동으로 출처 표시 의무가 생깁니다.

Cursor는 현재 일일 활성 사용자 100만 명을 넘겼고, 연간 매출 20억 달러(약 월 1억6천만 달러)를 기록 중이라는 보도가 있습니다. (출처: TechCrunch, 2026.03.02) 이미 라이선스 표시 조건을 충족하는 규모입니다. 이번에 Kimi 출처를 밝히지 않은 게 라이선스 위반 우려를 키웠던 이유가 여기에 있습니다.

결국 논란은 기술이 아닌 투명성과 라이선스 관리 문제였고, Cursor는 이 부분에서 먼저 움직였어야 했습니다. 다음 모델에선 베이스 모델을 공개하겠다는 약속을 공동창업자가 직접 했지만, 그 약속이 지켜지는지 지켜봐야 할 부분입니다.

▲ 목차로 돌아가기

이 조건에서만 Composer 2가 진짜 유리합니다

Cursor 안에서만, 긴 에이전트 작업일 때

Composer 2의 장점은 조건이 맞아야 빛납니다. Cursor 공식 문서에도 명시된 것처럼 이 모델은 Cursor 에디터 밖에서는 쓸 수 없습니다. 독립 API로 배포되는 게 아니라 Cursor의 에이전트 툴 스택(파일 편집, 터미널 제어, 웹 검색, 코드베이스 탐색)과 통합된 형태로만 제공됩니다. (출처: cursor.com/ko/docs/models/cursor-composer-2)

200K 컨텍스트 윈도우, self-summarization 기반의 장기 작업 처리 능력, 그리고 long-horizon coding task에 특화된 강화학습(RL) 훈련 이 세 가지가 결합됐을 때 진가가 나옵니다. 수십 개 파일에 걸쳐 리팩토링하거나, 레포지토리 전체를 파악하며 버그를 추적하는 작업이 대표적입니다. 짧은 코드 스니펫 생성이나 단발성 질의응답이라면 사실 Composer 2의 가격 장점이 체감될 만큼 차이를 만들어내기 어렵습니다.

✅ Composer 2가 유리한 상황
  • Cursor를 메인 IDE로 쓰고, 에이전트 모드(긴 작업 흐름)를 자주 사용하는 개인 개발자
  • 팀·엔터프라이즈 플랜에서 API 요금을 직접 부담하면서 비용 절감이 필요한 경우
  • Claude Opus 4.6이나 GPT-5.4 쓰던 것을 Cursor 안에서 대체 모델로 전환하고 싶은 경우
❌ 잘 맞지 않는 상황
  • Cursor 밖에서도 같은 모델을 API로 연결해 쓰려는 경우 (지원 안 됨)
  • 수학·일반 추론·창작 등 코딩 외 작업이 많은 경우 (코드 전용 훈련 모델)
  • Terminal-Bench 최고 성능이 필요한 경우 (GPT-5.4 Thinking이 75.1점으로 앞섬)

솔직히 말하면, Kimi 기반인 게 문제가 아닙니다. 문제는 처음부터 투명하게 밝히지 않았다는 것이고, 그 습관이 Composer 1(Qwen 기반)부터 이어졌다는 점입니다. 기술 선택 자체는 나쁘지 않습니다. 오픈소스를 잘 파인튜닝해서 프론티어 수준 가격 대비 성능을 만들어내는 건 오히려 실용적인 전략입니다. 다만 이걸 투명하게 공개할 용기가 있어야 신뢰도 따라옵니다.

▲ 목차로 돌아가기

Q&A

Composer 2는 Cursor 없이 단독으로 쓸 수 있나요?

현재 Cursor 에디터 안에서만 사용 가능합니다. 공식 문서에도 “Cursor 내에서 제공”이라고 명시돼 있으며, 독립 API 형태로는 배포되지 않습니다. 팀·엔터프라이즈 플랜에서도 Cursor 환경을 통해 요금이 청구됩니다.
Kimi K2.5 기반이면 중국 서버로 내 코드가 넘어가나요?

Cursor는 Fireworks AI의 미국 내 호스팅 인프라를 통해 Kimi K2.5를 상업적 파트너십 형태로 사용합니다. (출처: X/@Kimi_Moonshot, 2026.03.21) 추론 요청이 Moonshot AI 서버로 직접 전송되는 구조가 아닙니다. 다만 엔터프라이즈 수준의 데이터 주권 정책이 필요한 팀은 Cursor 공식 문서의 개인정보 처리 방침을 별도로 확인하는 게 좋습니다.
개인 Pro 플랜($20/월)에서 Composer 2 사용량 한도는 어떻게 되나요?

공식 Docs에는 “넉넉한 포함 사용량”이라고만 나오고 구체적인 토큰 수는 공개되지 않았습니다. 초과 시 API 토큰 요금이 추가 청구됩니다. Pro Plus($60/월)나 Ultra($200/월)는 더 높은 포함 사용량을 제공합니다.
Composer 2 Fast가 기본값인데, Standard로 바꿀 수 있나요?

현재 제품 내에서 Fast가 기본으로 설정돼 있습니다. Standard 전환 옵션 여부는 Cursor 공식 문서에서 별도 설명을 제공하지 않고 있습니다. 에이전트 모드에서 Auto를 선택하면 상황에 따라 자동으로 적합한 버전이 선택됩니다. 정확한 설정 방법은 Cursor 지원 채널(cursor.com/support)에서 확인하는 게 가장 빠릅니다.
Composer 1.5에서 Composer 2로 전환하면 바로 체감이 되나요?

CursorBench 기준으로 Composer 1.5(44.2점) → Composer 2(61.3점)는 38.7% 향상입니다. 특히 수백 개 단계를 거치는 장기 에이전트 작업에서 차이가 더 두드러집니다. 단발성 코드 완성 작업에서는 체감 차이가 상대적으로 적을 수 있습니다.

▲ 목차로 돌아가기

마치며

Cursor Composer 2 사태를 정리하면 이렇습니다. 기술 자체는 나쁘지 않습니다. Claude Opus 4.6 대비 10분의 1 요금에 CursorBench·Terminal-Bench에서 앞서는 구간이 실제로 있습니다. Kimi K2.5라는 오픈소스를 베이스로 쓴 것도 문제가 아닙니다. 실제로 Cursor 이전 모델 Composer 1도 Qwen 기반이었고, 오픈소스 파인튜닝은 업계에서 흔한 전략입니다.

문제는 단 하나였습니다. 처음부터 말하지 않았다는 것. 50억 달러 기업가치를 논하는 회사가 베이스 모델을 숨겼다는 사실은 개발자 커뮤니티 신뢰에 흠집을 냈습니다. 공동창업자 아만 상거가 공개 사과와 함께 다음 모델부터 베이스를 밝히겠다고 약속했으니, 그 약속이 지켜지는지 지켜보는 것도 의미가 있을 것 같습니다.

Cursor 안에서 긴 에이전트 코딩 작업을 자주 하는 분이라면, 논란에 흔들리기보다 실제 성능과 비용을 직접 확인해보는 게 가장 정확한 판단 기준입니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. Cursor 공식 블로그 — Composer 2 출시 발표 (cursor.com/ko/blog/composer-2)
  2. Cursor 공식 Docs — 모델 및 요금 (cursor.com/ko/docs/models/cursor-composer-2)
  3. TechCrunch — Cursor admits its new coding model was built on top of Moonshot AI’s Kimi (techcrunch.com, 2026.03.22)
  4. The Decoder — Cursor quietly built its new coding model on top of Chinese open-source Kimi K2.5 (the-decoder.com, 2026.03.21)
  5. VentureBeat — Cursor’s new coding model Composer 2 is here: It beats Claude Opus 4.6 but still trails GPT-5.4 (venturebeat.com, 2026.03.19)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 작성 기준일: 2026.03.25 / Cursor Composer 2 출시일: 2026.03.19 기준. 최신 요금 및 정책은 Cursor 공식 문서에서 확인하세요.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기