IT/AI
Devin 2.2, $20에 15분이 전부입니다
Cognition이 “가장 자율적인 AI 에이전트”라고 부르는 Devin 2.2. Core 플랜이 월 $20인데, 실제로 쓸 수 있는 시간은 약 135분입니다. 성공률과 PR 수락률까지 공식 수치로 직접 따져봤습니다.
Devin 2.2, 실제로 뭐가 바뀌었나
Devin 2.2는 2026년 2월 24일 Cognition이 공식 릴리스한 업데이트입니다. 이번 버전에서 가장 눈에 띄는 변화는 세 가지입니다. 첫째, 컴퓨터 사용(Computer Use) 기반 엔드투엔드 테스트가 추가됐습니다. 웹 앱뿐 아니라 Linux 데스크톱에서 앱을 직접 실행하고 화면 녹화 영상을 전달해 줍니다. (출처: Cognition 공식 블로그, 2026.02.24)
둘째, Devin Review Autofix로 PR을 열기 전에 스스로 코드를 검토하고 문제를 고칩니다. 셋째, 기동 속도가 기존 대비 3배 빨라졌고 인터페이스 전체가 새로 설계됐습니다. 공식 문서에는 “신규 사용자(2026.02.24 기준)는 Desktop 지원이 기본 활성화”라고 나와 있고, 기존 사용자는 Settings에서 직접 켜야 합니다.
요약하면, Devin 2.2는 ‘코드 작성 → 스스로 검토 → 버그 수정 → PR까지’ 루프를 사람 없이 돌리겠다는 구조로 진화했습니다. 기능만 놓고 보면 인상적이지만, 막상 요금 구조로 들어가면 이야기가 달라집니다.
$20에 ACU 9개 — 계산하면 이렇게 됩니다
Devin의 과금 단위는 ACU(Agent Compute Unit)입니다. 공식 문서에는 “1 ACU = Devin의 약 15분 분량 활성 작업”이라고 나와 있습니다. Core 플랜은 월 $20이고 여기에 ACU가 약 9개 포함됩니다. (출처: docs.devin.ai/admin/billing, Devin 공식 Pricing 페이지)
· 월 $20 → 포함 ACU ≈ 9개
· 1 ACU = 약 15분 활성 작업
· 9 ACU × 15분 = 총 약 135분(2시간 15분)
추가 구매 시
· 추가 ACU 단가: $2.25/ACU
· 1시간 작업 = 약 4 ACU = 약 $9
Teams 플랜 기준
· 월 $500 → 포함 ACU 250개
· 추가 단가: $2.00/ACU (Core보다 10% 저렴)
· 250 ACU × 15분 = 약 62.5시간/월
결론만 말하면, Core 플랜 $20로 한 달에 Devin을 쓸 수 있는 시간은 135분입니다. 복잡한 태스크는 단순 계산보다 ACU가 훨씬 빨리 소진됩니다. 공식 문서도 “태스크 복잡도, 프롬프트 명확도, 코드베이스 크기, 대화 길이에 따라 소비량이 달라진다”고 명시하고 있습니다. 모호한 프롬프트 하나가 크레딧을 태워버릴 수 있는 구조입니다.
Devin이 잘못된 방향으로 작업하다 실패해도 ACU는 소비됩니다. 실패에도 비용이 청구되는 구조라는 점이 핵심 리스크입니다.
성공률 13.86%를 공식이 직접 말합니다
“Devin이 주니어 개발자를 대체한다”는 말이 많이 퍼져 있습니다. X(구 트위터)에서도 “Devin 2.2가 주니어 개발자를 하룻밤에 대체했다”는 글이 바이럴됐습니다. 그런데 실제 수치는 다릅니다. Devin의 복잡한 태스크 공식 성공률은 13.86%입니다. (출처: mcplato.com 2026 AI Agent 비교 가이드, Cognition 공개 데이터 인용, 2026.03.18)
| 도구 | PR 수락률 | 특징 |
|---|---|---|
| Devin 2.2 | 49% | 비동기 클라우드, 처리량 최적화 |
| Codex Desktop | 64% | 대화형, 승인 4단계 모드 |
| GitHub Copilot | 35% | IDE 내 실시간 보조 |
PR 수락률 49%는 뒤집어 말하면, Devin이 생성한 PR 중 절반 이상이 실제로 머지되지 않는다는 뜻입니다. 그 실패한 PR에 쓴 ACU 비용은 환불되지 않습니다. 논문은 이 격차가 구현 문제가 아니라 “인간 기준선과의 구조적 차이”라고 표현했습니다.
단순하고 범위가 명확한 태스크에서는 Devin이 훨씬 좋은 결과를 냅니다. 실제로 핀테크 기업 Nubank는 600만 라인짜리 ETL 모노리스 마이그레이션에 Devin을 투입해 작업 속도 8~12배 향상, 비용 20배 이상 절감을 달성했습니다. (출처: cognition.ai, Nubank 사례 연구) 단, 이 사례는 명확하게 정의된 반복 태스크를 대량으로 처리한 결과입니다. 새로운 기능 개발이나 복잡한 버그 수정과는 맥락이 다릅니다.
코드가 내 서버 밖을 나간다는 뜻
Devin은 100% 클라우드 샌드박스에서 실행됩니다. 세션을 시작하는 순간 소스 코드가 Cognition의 인프라로 올라갑니다. (출처: docs.devin.ai, 공식 문서) 공식 문서에는 “Devin runs entirely in Cognition’s cloud sandbox”라고 나옵니다.
| 항목 | Devin 2.2 | Codex Desktop |
|---|---|---|
| 코드 위치 | Cognition 클라우드 | 로컬 유지 가능 |
| 네트워크 기본값 | 항상 연결 | 기본 OFF |
| 요금 구조 | ACU 변동 과금 | 구독 고정 |
| OS 지원 | 브라우저+Slack | macOS·Windows·Linux |
금융, 의료, 공공 분야처럼 데이터 레지던시 규정이 있는 팀에게 이 차이는 단순한 기능 차이가 아닙니다. Devin을 쓰는 순간 코드베이스가 미국 클라우드로 올라간다는 점을 사전에 법무·보안 팀과 확인해야 합니다.
Devin 2.2가 진짜 잘 맞는 상황
Devin이 가장 빛나는 건 반복적이고 명확하게 정의된 대량 작업입니다. Nubank 사례가 교과서입니다. 100,000개 데이터 클래스를 같은 패턴으로 마이그레이션하는 작업, 레거시 ETL을 서브모듈로 분리하는 작업처럼 “한 번 잘 가르치면 수천 번 똑같이 돌려도 되는” 태스크에서 ROI가 나옵니다.
반대로 새로운 기능 설계, 아직 스펙이 불분명한 리팩터링, 여러 서비스가 얽힌 통합 작업은 ACU가 예측 불가능하게 소진됩니다. 공식 문서도 “명확하게 범위가 정해진 태스크를 위임하고, 세션 하나에 여러 작업을 몰아 넣지 말라”고 권고합니다. (출처: docs.devin.ai/admin/billing)
실용적인 기준을 하나 제시하면, 같은 작업을 본인이 직접 하면 5분 안에 끝나는 건 굳이 Devin에게 맡길 이유가 없습니다. ACU 비용이 더 나옵니다. 반면, 사람이 하면 지루해서 실수가 나오는 반복 작업 묶음은 Devin이 확실히 유리합니다.
Cursor·Codex와 비교하면 숫자가 달라집니다
Cursor는 월 $20 고정 구독, GitHub Copilot은 월 $10입니다. SWE-Bench Verified 기준으로 Copilot이 56.0%를 해결하고, Cursor는 51.7%를 해결합니다. 더 싼 Copilot이 점수가 높습니다. (출처: morphllm.com/comparisons/cursor-vs-copilot, 2026.03.04)
| 도구 | 월 최소 비용 | 과금 방식 | 코드 로컬 유지 |
|---|---|---|---|
| Devin 2.2 Core | $20 + 추가 ACU | 변동 (ACU) | 불가 |
| Cursor Pro | $20 고정 | 고정 구독 | 가능 |
| GitHub Copilot | $10 고정 | 고정 구독 | 가능 |
Devin이 비싼 것 자체가 문제는 아닙니다. 문제는 비용이 예측 안 된다는 점입니다. Cursor나 Copilot은 월말에 청구서를 보고 놀랄 일이 없습니다. Devin Core 플랜에서 복잡한 태스크를 처음 써보면 $20 크레딧이 생각보다 빨리 없어지는 경험을 할 수 있습니다. Cognition 공식 문서도 “Core 플랜에서는 먼저 내부 ACU 소비 기준을 파악한 후 Teams 플랜으로 전환하라”고 권고하고 있습니다. (출처: augmentcode.com, 2026.03.14 인용)
개인 개발자나 소규모 팀이 Devin을 처음 도입한다면, 신규 가입 시 제공하는 $10 무료 크레딧으로 먼저 ACU 소비 패턴을 측정해보는 것이 손해를 줄이는 방법입니다.
Q&A 5가지
Q1. Devin 2.2는 무료로 쓸 수 있나요?
신규 가입 시 $10 크레딧을 무료로 제공합니다. $10 = 약 4.4 ACU(Core 단가 $2.25 기준), 즉 약 66분 분량입니다. 이후에는 유료 플랜(Core $20/월 시작)이나 추가 ACU 구매가 필요합니다. (출처: cognition.ai/blog/introducing-devin-2-2)
Q2. ACU가 남으면 다음 달로 이월되나요?
구독 포함 ACU(Subscription ACU)는 결제 주기가 끝나면 소멸합니다. 별도로 구매한 유료 ACU(PAYG ACU)와 무료 증정 ACU(Gift ACU)는 만료일 없이 유지됩니다. (출처: docs.devin.ai/admin/billing)
Q3. Desktop 테스트 기능은 어떻게 켜나요?
2026년 2월 24일 이후 신규 가입자는 기본 활성화 상태입니다. 기존 사용자는 app.devin.ai/customization → Settings에서 Desktop을 직접 켜야 합니다. (출처: cognition.ai/blog/introducing-devin-2-2)
Q4. Devin이 실패해도 ACU가 소비되나요?
네, 소비됩니다. Devin이 응답 대기 중이거나 테스트 실행을 기다리는 동안, 저장소 클론 중에는 ACU가 차감되지 않습니다. 하지만 작업 도중 잘못된 방향으로 진행하다 실패하면 그 과정에서 소비된 ACU는 환불되지 않습니다. (출처: docs.devin.ai/admin/billing)
Q5. Teams 플랜은 Core 플랜과 무엇이 다른가요?
Teams 플랜은 월 $500에 ACU 250개를 포함하고, 동시 세션 수 제한이 없습니다. 추가 ACU 단가도 $2.00(Core $2.25보다 11% 저렴)으로 낮아집니다. 대규모 마이그레이션처럼 태스크를 동시에 여러 세션으로 쪼개 병렬 처리할 때 유리합니다. (출처: docs.devin.ai/admin/billing, devin.ai/pricing)
마치며
Devin 2.2는 기능 자체는 인상적입니다. 스스로 테스트하고 버그를 잡고 PR까지 올리는 루프는 분명 이전에 없던 경험입니다. 그런데 이걸 쓰기 전에 알아야 할 숫자들이 있습니다. $20 Core 플랜 = 약 135분. PR 수락률 = 49%. 복잡한 태스크 성공률 = 13.86%.
이 수치들이 Devin을 쓰지 말라는 이야기는 아닙니다. 명확하게 정의된 반복 작업, 대규모 마이그레이션, 테스트 자동화처럼 Devin이 잘 맞는 상황이 분명히 있습니다. 다만 “AI가 내 코딩을 다 해준다”는 기대로 시작하면 ACU가 예상보다 훨씬 빨리 소진됩니다.
가장 실용적인 접근은 $10 무료 크레딧으로 실제 ACU 소비 패턴을 먼저 측정하는 것입니다. 그 데이터를 보고 나서 Core를 유지할지, Teams로 올릴지, 아니면 Cursor나 Codex 쪽이 맞는지 판단하는 게 순서입니다.
본 포스팅은 2026년 2월 24일 기준 Devin 2.2 공식 자료를 바탕으로 작성되었습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
ACU 단가·플랜 구성·요금 정책은 Cognition 정책에 따라 수시로 바뀔 수 있으니
최신 정보는 devin.ai/pricing에서 직접 확인하세요.






댓글 남기기