Research Preview
macOS 전용
Pro / Max 전용
Claude Computer Use,
성공률 50%의 진짜 의미
2026년 3월 23일, Anthropic이 Claude Cowork와 Claude Code에 공식 추가한 Computer Use. 공식 블로그 제목은 “Put Claude to work on your computer.” 하지만 공식 발표 어디에도 나오지 않는 숫자가 있습니다. 실제 성공률 약 50%. Pro 구독자가 GitHub PR 하나 맡겼더니 남은 한도가 52%→91%로 튀었다는 사례도 있습니다. 쓰기 전에 알고 시작하는 것과 모르고 시작하는 것은 꽤 다릅니다.
공식 발표에서 꺼낸 핵심 — 실제로 무엇이 달라졌나
Claude Computer Use는 2026년 3월 23일, Anthropic의 공식 릴리스노트와 블로그를 통해 동시에 공개됐습니다. 공식 문서에 딱 이렇게 나옵니다: “Users on Pro and Max plans can give Claude access to computer use. Claude can open files, run dev tools, point, click, and navigate to what’s on your screen to perform tasks itself — with no setup required.” (출처: Anthropic 공식 릴리스노트, 2026.03.23)
이전까지 Claude가 접근하던 방식과 결정적으로 다른 지점은 ‘커넥터 없는 앱을 직접 건드린다’는 것입니다. Slack, Google Calendar처럼 이미 커넥터가 연결된 서비스는 기존처럼 API로 조작하지만, 커넥터가 없는 네이티브 앱이나 로컬 파일은 화면을 직접 보고 마우스를 움직여 처리합니다. 별도 설치 없이 Mac 데스크톱 앱이 설치된 상태에서 설정 토글 하나로 켜집니다.
한 가지 더 챙겨둘 사실이 있습니다. Anthropic은 2026년 2월 25일 Vercept라는 에이전트 전문 스타트업을 인수했습니다. (출처: TechCrunch, 2026.02.25) Computer Use가 일회성 실험이 아니라 장기 방향이라는 신호로 읽힙니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
공식 블로그는 “no setup required”를 강조하지만, 실제로는 macOS 접근성(Accessibility)·화면 녹화(Screen Recording) 권한 2가지를 직접 허용해야 합니다. ‘설정이 필요 없다’는 표현은 별도 소프트웨어 설치가 없다는 뜻이지, 권한 허용이 필요 없다는 뜻이 아닙니다.
두 가지 작동 모드 — 마케팅 영상과 현실의 차이
공식 데모 영상에서 Claude가 뚝딱뚝딱 빠르게 작업을 처리하는 장면을 보고 “내 컴퓨터에서도 이렇겠지”라고 생각했다면, 이 부분을 먼저 읽어야 합니다. Computer Use에는 속도가 완전히 다른 두 가지 경로가 있습니다.
Connector 모드
Slack, Google Calendar, Gmail 등 커넥터가 연결된 서비스는 API를 직접 호출합니다. 수 초 안에 처리되고 스크린샷을 전송하지 않으므로 토큰 소비도 최소입니다. 데모 영상 대부분이 이 경로입니다.
스크린샷 루프 모드
커넥터가 없는 네이티브 앱은 스크린샷 → 분석 → 클릭 → 스크린샷 루프를 반복합니다. 한 동작마다 화면 캡처 이미지를 Anthropic 서버로 전송해야 합니다. 뉴스레터 3개 구독 취소에 30분이 걸린 PCWorld 사례가 이 경로입니다. (출처: PCWorld, 2026.03)
Anthropic 공식 블로그에 이렇게 나옵니다: “working through your screen is slower than using a direct integration.” (출처: claude.com/blog/dispatch-and-computer-use, 2026.03.23) 공식 발표문 안에 이미 스크린샷 모드가 느리다는 사실이 적혀 있습니다. 대부분의 Mac 네이티브 앱은 현재 커넥터가 없어 느린 경로로 처리됩니다.
막상 써보면 “이거 생각보다 느린데?”라는 반응이 많은 이유입니다. 빠른 데모 영상은 커넥터가 구비된 서비스를 쓴 것이고, 실제로 내 컴퓨터의 앱 대부분은 스크린샷 모드로 처리됩니다.
Pro $20로 버틸 수 있을까 — 토큰 소비의 현실
Computer Use는 Claude의 다른 기능과 비교해서 토큰을 압도적으로 많이 씁니다. 스크린샷 모드로 작동하면 한 동작마다 화면 이미지를 서버로 전송하는데, 시각적 이해(Vision)가 Claude 기능 중 토큰을 가장 많이 잡아먹는 연산입니다.
⚠️ 실측 사례 (Max $200/월 구독자)
GitHub PR 회귀 테스트 한 건을 맡겼더니 남은 한도가 52%에서 91%로 뛰었습니다. 단 한 작업으로 한도의 39%가 소진됐습니다. (출처: Reddit r/ClaudeAI, 2026년 3월 커뮤니티 보고) 이 수치는 Max $200 플랜 기준이고, Pro $20 플랜은 메시지 한도가 훨씬 낮습니다.
솔직히 말하면 Pro $20 플랜으로 Computer Use를 일상 업무에 쓰는 건 현실적으로 어렵습니다. 작업 몇 번이면 주간 한도가 빠르게 소진됩니다. Anthropic 공식 지원 문서에서도 Computer Use는 Pro와 Max 모두 지원한다고 나와 있지만, 실제 커뮤니티 경험상 Max $100 이상이 사실상 출발점에 가깝습니다.
| 플랜 | 월 구독료 | Computer Use | 현실적 평가 |
|---|---|---|---|
| Pro | $20 | ✅ 지원 | 간단한 파일 작업 몇 번으로 한도 소진 가능 |
| Max 5x | $100 | ✅ 지원 | 일상 업무에 쓰려면 사실상 이 플랜부터 |
| Max 20x | $200 | ✅ 지원 | PR 테스트 한 건에 39% 소진 사례 있음 |
| Team / Enterprise | $20/seat~ | ❌ 미지원 | 2026.03 기준 아직 지원 안 됨 |
(출처: Anthropic 공식 지원센터 플랜 비교, 2026.03.23 기준 / nowadais.com 정리)
💡 Team 구독자라면 아직 쓸 수 없는 이유
공식 지원 문서를 확인하면 Team과 Enterprise 플랜은 Computer Use 리서치 프리뷰 대상에서 빠져 있습니다. 조직 계정으로 Claude를 쓰는 상황이라면 개인 Pro 또는 Max 계정이 별도로 필요합니다. Anthropic이 별도 이유를 공식 문서에서 밝히지 않았습니다.
Operator·browser-use와 수치로 비교해봤습니다
Claude Computer Use가 “AI가 화면을 조작한다”는 콘셉트 자체는 새롭지 않습니다. OpenAI의 Operator, 오픈소스인 browser-use가 이미 같은 영역에 있습니다. 벤치마크 수치가 있으니 직접 확인해보겠습니다.
| 항목 | Claude Computer Use | OpenAI Operator | browser-use |
|---|---|---|---|
| WebVoyager 점수 | 56% | 87% | 89% |
| OSWorld 점수 | 22% | 38.1% | N/A |
| macOS 네이티브 앱 제어 | ✅ | ❌ | ❌ (브라우저만) |
| 비용 구조 | 구독($20~) | ChatGPT Pro 포함 | 오픈소스, API 비용만 |
| Windows 지원 | 미지원 (예정) | ✅ | ✅ |
(출처: Helicone 벤치마크 비교 분석, 2026.03 / shareuhack.com 정리)
WebVoyager·OSWorld 수치만 보면 Claude가 밀립니다. 그런데 이 숫자를 그대로 “Claude가 나쁘다”로 해석하면 함정이 있습니다. WebVoyager는 웹 작업 중심 벤치마크이고, OSWorld는 OS 수준 명령 실행 중심입니다. Claude Computer Use의 강점은 ‘macOS 네이티브 앱을 직접 건드릴 수 있는 유일한 선택지’라는 점인데, 그 부분을 측정하는 공개 벤치마크는 2026년 3월 기준으로 아직 없습니다.
💡 벤치마크 숫자보다 먼저 따져야 할 것
내가 자동화하고 싶은 작업이 ‘브라우저 안에서 이루어지는 일’이면 browser-use나 Operator가 더 낫습니다. ‘Mac 로컬 앱 — Finder, 미리보기, 터미널, IDE 같은 것’을 건드려야 하는 작업이라면 현재 Claude Computer Use가 유일한 노코드 선택지입니다. 도구 선택은 점수가 아니라 내 작업의 영역으로 판단해야 합니다.
/schedule과 결합하면 달라지는 구조
Computer Use 단독으로는 “내가 시키는 동안만 동작하는 보조 도구”입니다. 그런데 3월 17일에 함께 출시된 Dispatch 기능, 그리고 Claude Code의 /loop(예약 실행)와 결합하면 성격이 달라집니다.
개발자 Gagan Saluja는 공개 게시글에서 이렇게 말했습니다: “combine this with /schedule that just dropped and you’ve basically got a background worker that can interact with any app on a cron job. that’s not an AI assistant anymore, that’s infrastructure.” (출처: Twitter/X, 2026.03.23) 단순히 “AI 보조 도구”가 아니라, 앱과 통신하는 백그라운드 워커, 즉 인프라처럼 동작하기 시작한다는 얘기입니다.
💡 Dispatch + Computer Use 결합 예시 시나리오
- 출근길 지하철에서 폰으로 “오전 10시 회의 전까지 지난주 PR 정리해서 슬랙에 보내줘”라고 메시지
- Mac이 켜진 상태에서 Claude가 GitHub, IDE, Slack을 직접 열고 작업 진행
- 회사 도착하면 슬랙에 결과물이 올라가 있는 구조
단, 이 구조가 작동하려면 Mac 데스크톱이 수면 상태에 들어가지 않고 계속 켜져 있어야 합니다. Claude Desktop 앱도 실행 상태를 유지해야 합니다. 외출하면서 맥북을 닫으면 Dispatch로 보낸 작업이 실행되지 않습니다. 이 부분이 현재 구조의 가장 큰 실용적 제약입니다.
보안 위험 — 프롬프트 인젝션은 진짜 문제입니다
Anthropic 공식 블로그에 직접 나옵니다: “Computer use is still early compared to Claude’s ability to code or interact with text. We recommend starting with the apps you trust and not working with sensitive data.” (출처: claude.com/blog/dispatch-and-computer-use, 2026.03.23) 공식 발표문에서 민감한 데이터는 쓰지 말라고 명시한 겁니다.
ZombAIs 보안 연구에서 실증된 공격 시나리오가 있습니다: Claude가 브라우저로 악의적으로 제작된 웹페이지를 읽으면, 그 페이지 안에 숨겨진 명령어가 Claude에게 전달되어 사용자 모르게 다른 행동을 실행할 수 있습니다. 이것이 프롬프트 인젝션입니다. Anthropic은 “활성화 스캐닝” 방어를 구축했다고 밝혔지만, “threats are constantly evolving”이라고 스스로 인정합니다. (출처: claude.com/blog/dispatch-and-computer-use)
⚠️ 기본 보안 설정 체크리스트
- Computer Use 전용 작업 폴더를 별도로 만들고 해당 폴더만 접근 허용
- 인터넷 뱅킹, 암호화폐 지갑 앱은 기본적으로 차단됨 — 별도로 허용하지 말 것
- 작업 시작 전 개인정보가 담긴 앱과 브라우저 탭은 모두 닫기
- 처음엔 Downloads 폴더 정리, 파일 변환 같은 저위험 작업부터 시작
- 언제든 작업 중단 가능 — 이상한 움직임이 보이면 즉시 멈추기
위험이 0은 아닙니다. 하지만 “아예 쓰지 않는다”가 아니라 “Claude가 건드릴 수 있는 범위를 좁힌다”는 전략으로 리스크를 줄일 수 있습니다. 핵심은 Claude가 볼 수 있는 화면에 뭐가 있는지 통제하는 것입니다.
시작하기 전에 따져볼 3가지 질문
기능 소개보다 더 실용적인 건 “내가 이걸 써야 하나”를 판단하는 기준입니다. 커뮤니티 경험과 공식 자료를 종합하면 3가지 필터로 정리됩니다.
이 작업에 속도가 중요한가?
빠른 처리가 필요하면 Computer Use는 적합하지 않습니다. 스크린샷 모드에서 30분이 걸리는 작업을 기다리기 어렵다면 다른 방법을 찾는 게 낫습니다.
작업이 실패해도 다시 시도할 수 있나?
현재 성공률이 약 50%입니다. 한 번에 정확하게 처리돼야 하는 작업 — 고객사 이메일 발송, 중요 계약서 편집 등 — 은 맡기면 안 됩니다. 재시도해도 괜찮은 반복 작업에 적합합니다.
화면에 민감한 데이터가 있나?
Computer Use를 켜면 Claude는 화면에 보이는 모든 것을 볼 수 있습니다. 개인정보, 의료기록, 금융 정보가 담긴 앱이 열려 있는 상태에서 쓰면 안 됩니다. 작업 전에 화면 정리가 먼저입니다.
세 질문 중 하나라도 “이 조건에 맞지 않는다”면 지금 시점에서는 쓰지 않는 쪽이 낫습니다. 가장 잘 맞는 첫 작업은 Downloads 폴더 정리나 Word → PDF 일괄 변환입니다. 저위험에 반복 가능하고, 민감한 데이터가 없습니다.
Q&A
Q1
Windows에서도 쓸 수 있나요?
Q2
Pro $20 플랜에서 실제로 얼마나 쓸 수 있나요?
Q3
Dispatch를 쓰려면 Mac이 계속 켜져 있어야 하나요?
Q4
Claude Code와 Claude Cowork 중 어디서 쓰는 게 낫나요?
Q5
Excel 파일 작업도 맡길 수 있나요?
마치며 — “쓸 만하다”와 “지금 당장 모두에게”는 다른 얘기입니다
Claude Computer Use를 한 줄로 정리하면 이렇습니다: 조건이 맞으면 꽤 쓸 만하고, 조건이 안 맞으면 토큰만 날립니다. macOS 사용자이고, Max 이상 구독자이고, 속도가 크게 중요하지 않은 반복 작업이 있고, 민감한 데이터가 없는 환경이라면 — 지금 당장 Downloads 폴더 정리부터 시켜보면 됩니다.
성공률 50%, 벤치마크 OSWorld 22%, Team 플랜 미지원, Windows 미지원. 이 숫자들이 기능이 나쁘다는 뜻은 아닙니다. 아직 초기라는 뜻입니다. Anthropic은 2025년 초부터 이 기능을 Claude 3.5 Sonnet에서 실험해왔고, Vercept 인수까지 단행했습니다. 방향은 명확하고, 개선 여지도 큽니다.
이 부분이 좀 아쉬웠습니다. 공식 마케팅이 커넥터 모드 기반 빠른 데모만 보여주면서, 정작 대부분의 사용 상황인 스크린샷 모드의 느린 속도와 높은 토큰 소비를 충분히 알리지 않았습니다. 기대와 현실의 간격이 클 때 사람들은 “별로”라고 판단하고 떠납니다. 조건을 알고 시작하면 같은 기능도 다르게 느껴집니다.
📚 본 포스팅 참고 자료
- Anthropic 공식 블로그 — “Put Claude to work on your computer” (claude.com/blog/dispatch-and-computer-use)
- Anthropic 공식 릴리스노트 — March 23, 2026 업데이트 (support.anthropic.com)
- Helicone — WebVoyager·OSWorld 벤치마크 비교 (helicone.ai)
- NowadAIs — Claude Computer Use 한계 분석 (nowadais.com)
- PCWorld — “Claude controlled my Mac for half an hour” 실사용 리뷰 (2026.03)
- GitHub anthropics/claude-code Issue #26018 — Read tool 20MB 오류 보고
본 포스팅은 2026년 3월 27일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Claude Computer Use는 현재 리서치 프리뷰 단계이며, Anthropic이 수시로 사양을 조정하고 있습니다. 최신 정보는 Anthropic 공식 문서를 통해 확인하시기 바랍니다.











댓글 남기기