Claude Sonnet 4.6 / Opus 4.6 기준
리서치 프리뷰 — macOS 전용
Claude Computer Use, 자동이라고요?
이 조건 먼저 보세요
2026년 3월 23일, Anthropic이 Claude Computer Use를 리서치 프리뷰로 공개했습니다. “AI가 Mac을 직접 조작한다”는 헤드라인만 보면 완전 자동 에이전트처럼 느껴지는데, 막상 공식 문서를 열어보면 이야기가 달라집니다. 쓸 수 있는 조건이 생각보다 훨씬 좁고, 실제 속도는 답답할 만큼 느립니다.
① Computer Use가 실제로 작동하는 구조
Anthropic 공식 블로그를 직접 읽어보면 이런 문장이 나옵니다. “Claude will reach for the most precise tool first, starting with connectors to services like Slack or Google Calendar. When there isn’t a connector, Claude can directly control your browser, mouse, keyboard, and screen.” (출처: claude.com/blog/dispatch-and-computer-use, 2026.03.23) 한 문장으로 정리하면, Computer Use는 다른 방법이 전부 막혔을 때 비로소 켜지는 최후 수단입니다.
Lifehacker가 실제로 테스트한 결과에도 이 구조가 그대로 드러납니다. Gmail에 이메일 초안 작성은 MCP 커넥터가 처리하지만, 전송 버튼을 누르는 행위는 커넥터 범위 밖이어서 Claude for Chrome 확장을 통해 브라우저를 직접 제어해야 합니다. 그리고 Apple 캘린더처럼 Google Calendar 커넥터가 없는 앱에서는 그때서야 마우스·키보드 제어가 발동됩니다. “AI가 Mac 전체를 자유자재로 다룬다”는 인상과 실제 동작 방식 사이에 꽤 큰 간격이 있습니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
커넥터(통합 앱) → 브라우저 제어 → 전체 화면 제어 순으로 단계가 나뉩니다. 실사용자 대부분이 체감하는 “Computer Use 기능”은 사실 이 세 단계 중 마지막 단계에 해당하며, 일상적 작업에서는 생각보다 드물게 발동됩니다.
전체 화면을 제어하는 단계에 들어가면 화면이 잠기고, Claude가 스크린샷을 찍으면서 한 동작씩 판단합니다. 이 구조는 2024년 말 Computer Use 초기 버전과 동일한 방식입니다. 스크린샷을 이어 붙이는 방식이기 때문에, 짧게 지나가는 알림이나 빠른 UI 변화를 놓칠 수 있다는 점은 Anthropic 공식 연구 문서에서도 언급합니다. (출처: anthropic.com/news/developing-computer-use)
② 벤치마크 72.5%가 의미하는 것과 의미하지 않는 것
Anthropic이 이번 발표에서 가장 강조한 수치는 OSWorld 벤치마크 72.5%입니다. 2024년 말 Computer Use를 처음 공개했을 때 14.9%였던 게, Claude Sonnet 4.6 기준으로 72.5%까지 올랐습니다. (출처: anthropic.com/news/acquires-vercept, 2026.02) 인간 기준선이 70~75% 수준이니, 수치만 보면 인간을 따라잡은 것처럼 읽힙니다.
💡 벤치마크와 실사용 사이에 왜 이렇게 차이가 나는지를 이 숫자 하나가 설명합니다.
OSWorld는 통제된 평가 환경에서의 성공률입니다. 실제 Mac 환경에는 예상치 못한 다이얼로그, 앱 업데이트, 화면 상태 변화가 상시 발생합니다. 평가에서 72.5%를 찍어도, 당신의 Downloads 폴더를 Finder로 탐색하는 데 실패할 수 있습니다.
Lifehacker가 직접 테스트한 결과를 보면 이게 숫자 이상의 문제입니다. 스크린샷 파일을 특정 폴더로 이동하는 작업을 시켰더니, Claude는 1~2분 동안 경로를 찾지 못하다가 결국 Finder의 “폴더로 이동” 기능을 수동으로 입력하는 방식으로 우회했습니다. 캘린더 이벤트 추가도 30초가 걸렸고, 잘못된 캘린더에 등록해서 수정하는 데 30초가 더 필요했습니다. 벤치마크 수치가 높다고 해서 일상 업무 속도가 사람보다 빠르다는 뜻이 아닙니다.
| 시점 | OSWorld 점수 | 비고 |
|---|---|---|
| 2024년 말 (초기 공개) | 14.9% | 당시 최고 성능 모델 |
| 2026년 3월 (Sonnet 4.6) | 72.5% | 인간 기준 70~75% 수준 |
| 2026년 3월 (Opus 4.6) | 72.7% | Sonnet과 거의 동일 |
※ 출처: Anthropic 공식 발표 (anthropic.com/news/acquires-vercept) / 인간 기준선 70~75%는 OSWorld 평가 기준
③ 쓸 수 있는 조건: 요금제·기기·앱 제한
공식 문서에서 확인한 사용 조건은 다음과 같습니다. Claude Pro($20/월) 또는 Claude Max($100/월 이상) 구독자만 접근 가능하고, 기기는 macOS 전용입니다. Windows와 Linux는 현재 미지원이며, Anthropic이 공식적으로 지원 계획을 밝히지 않은 상태입니다. (출처: claude.com/blog/dispatch-and-computer-use, 2026.03.23)
활성화 방법은 데스크탑 앱의 설정 → General → Computer Use에서 토글을 켜는 방식입니다. 기본값은 비활성화입니다. Screen Recording 권한과 Accessibility 권한을 시스템에서 허용해야 하고, Claude가 새 앱에 접근할 때마다 매번 사용자 승인을 받습니다.
앱 제한 — 기본 차단 목록
Anthropic이 기본값으로 접근을 막아둔 앱 카테고리가 있습니다. 1Password 같은 패스워드 매니저, 인터넷뱅킹 앱이 여기에 해당합니다. 설정에서 Denied Apps 목록을 직접 추가할 수 있으며, Anthropic은 민감한 데이터가 있는 앱부터 이 목록에 추가할 것을 권고합니다. (출처: TechRadar, 2026.03.24 / 공식 블로그 안전 가이드 지참)
Mac이 잠겨 있거나 절전 모드 상태면 Computer Use가 작동하지 않습니다. 스크린샷 기반으로 화면을 읽는 구조이기 때문에, 화면이 꺼져 있으면 Claude는 아무것도 볼 수 없습니다. Reddit 사용자들이 지적했듯, 집에 놓고 온 Mac에 Dispatch로 원격 지시를 넣어도 잠금 화면이 뜨면 그냥 멈춥니다. 데스크탑 앱이 깨어 있어야 한다는 조건이 생각보다 중요합니다.
④ Dispatch와 연결하면 달라지는 점
Dispatch는 2026년 3월 16일에 먼저 출시됐고, 이번 Computer Use 발표와 함께 더 넓은 주목을 받았습니다. 핵심은 폰에서 지시 → Mac에서 실행 → 결과 확인이라는 흐름입니다. Claude.ai 모바일 앱과 데스크탑 앱이 하나의 대화 스레드로 연결되어, 출근길에 지시를 넣으면 집 Mac에서 Claude가 알아서 작업을 처리하고, 돌아왔을 때 결과물이 준비되어 있습니다.
이 기능의 배경에는 Vercept AI 인수가 있습니다. Anthropic은 2026년 2월 시애틀 기반 스타트업 Vercept를 인수했는데, Vercept 팀이 Anthropic 합류 후 4주 만에 Dispatch를 출시했습니다. Vercept의 공동창업자 Kiana Ehsani가 직접 이를 밝혔습니다. (출처: unite.ai, 2026.03.24 / anthropic.com/news/acquires-vercept) 스타트업 제품이 흡수되어 기능이 탄생하는 속도입니다.
💡 Vercept가 운영하던 외부 제품 Vy는 3월 25일 서비스 종료됐습니다.
기존 Vy 사용자에게는 30일 전 사전 공지가 갔고, 팀 전체가 Anthropic으로 이동했습니다. Dispatch는 사실상 Vy의 후속 제품입니다. 단, 클라우드 기반이던 Vy와 달리 Dispatch는 처리가 로컬 Mac에서 이뤄집니다.
Dispatch + Computer Use 조합의 실제 활용 예시로 Anthropic이 제시한 건 이렇습니다. 아침 출근 전 폰으로 “오늘 중요 이메일 정리해서 브리핑 만들어줘”라고 입력하면, Claude가 Mac에서 메일 앱을 열고 화면을 읽으며 요약본을 Markdown 파일로 저장합니다. 이상적인 시나리오이고, 실제로 잘 작동하는 경우도 있습니다. 다만 Mac이 잠겨 있거나 커넥터가 없는 앱이 중간에 끼면 작업이 멈춥니다.
⑤ 보안 문제, Anthropic이 공개한 내용과 공개 안 한 내용
Anthropic이 공식적으로 인정한 가장 큰 위험 요소는 프롬프트 인젝션입니다. Claude가 화면을 읽는 과정에서 악의적인 텍스트를 화면에 표시해 Claude의 동작을 조작하는 공격 방식입니다. 공식 블로그에는 이렇게 쓰여 있습니다. “When Claude uses your computer, our system will automatically scan activations within the model to detect for such activity.” (출처: claude.com/blog/dispatch-and-computer-use, 2026.03.23) 탐지 시스템을 구축했다고 밝혔지만, 이 스캔이 어떤 원리로 작동하고 어느 범위까지 막는지에 대한 기술 세부 정보는 현재 공개되지 않은 상태입니다.
⚠️ Anthropic이 직접 권고한 주의 사항
- 민감한 데이터가 있는 작업에는 사용하지 말 것
- 처음에는 신뢰하는 앱부터 시작할 것
- 1Password, 인터넷뱅킹은 기본 차단 목록에 추가할 것
- 작업 중 언제든 중단할 수 있는 상태를 유지할 것
2024년 Computer Use 초기 연구 문서에서 Anthropic은 스크린샷 기반 구조의 한계를 이미 언급했습니다. “flipbook nature of Claude’s view of the screen”이라는 표현이 그것인데, 스크린샷을 이어 붙이는 방식이라 짧게 지나가는 알림이나 동작을 놓칠 수 있다는 뜻입니다. (출처: anthropic.com/news/developing-computer-use) Vercept 팀이 이 구조적 한계를 해결했는지는 아직 공개된 자료가 없습니다.
Reddit에서 가장 많이 나온 실용적인 대안은 “메인 컴퓨터에서 직접 쓰지 말고, Claude 전용 Mac mini를 따로 두는 것”입니다. 실제로 Lifehacker 리뷰어도 같은 결론에 도달했습니다. 격리된 환경에서 쓰면 보안 위험을 상당히 낮출 수 있지만, 그렇게 할 수 있는 사용자 층이 얼마나 될지는 별개의 문제입니다.
⑥ OpenClaw와 비교하면 어디가 다른가
이번 발표를 두고 Reddit에서는 “Anthropic의 OpenClaw 대응”이라는 평가가 많았습니다. OpenClaw는 오픈소스 AI 에이전트로, 텔레그램·WhatsApp 같은 메시징 앱을 통해 로컬에서 AI가 컴퓨터 작업을 처리하는 방식으로 개발자 커뮤니티에서 폭발적으로 성장한 프로젝트입니다. 실제로 MacRumors도 Claude Computer Use를 “Anthropic’s version of OpenClaw”라고 표현했습니다.
| 항목 | Claude Computer Use | OpenClaw |
|---|---|---|
| 지원 OS | macOS 전용 | macOS·Windows·Linux |
| 데이터 처리 | 로컬 처리 | 로컬 처리 (일부 클라우드) |
| 모델 선택 | Claude 전용 | 거의 모든 모델 지원 |
| 권한 모델 | 앱 단위 승인 필수 | 설정에 따라 매우 유동적 |
| 설정 난이도 | 설정 토글 방식, 비교적 단순 | 플러그인 설정 복잡, 진입 장벽 높음 |
Claude Computer Use는 OpenClaw보다 훨씬 제한적이지만, 그 제한이 오히려 안전성을 높이는 쪽으로 작용합니다. OpenClaw는 설정을 잘못하면 보안 구멍이 크게 열릴 수 있고, Reddit에서도 “OpenClaw 자체가 구조적으로 위험하다”는 지적이 나왔습니다. Claude 쪽은 폴백 구조와 앱 단위 승인 덕분에 최소한 “Claude가 뭘 하고 있는지는 볼 수 있다”는 장점이 있습니다.
⑦ 지금 당장 써도 되는 상황 vs 기다리는 게 나은 상황
Anthropic 공식 블로그가 직접 쓴 문장이 있습니다. “It won’t always work perfectly: complex tasks sometimes need a second try, and working through your screen is slower than using a direct integration.” (출처: claude.com/blog/dispatch-and-computer-use) 제조사가 직접 “완벽하지 않다, 느리다”고 쓴 서비스입니다. 쓸 상황과 쓰면 안 되는 상황을 구분하는 게 현실적입니다.
- MCP 커넥터가 없는 레거시 앱 자동화
- 반복적이고 단순한 데이터 입력 작업
- 브라우저 탐색 + 결과 저장 흐름
- 24시간 켜두는 전용 Mac mini 환경
- 민감하지 않은 데이터만 다루는 작업
- 패스워드, 금융 정보 관련 작업
- 빠른 속도가 필요한 시간 민감 업무
- Windows·Linux 환경
- Claude Pro·Max 비구독자
- 기업 IT 보안 정책이 엄격한 환경
솔직히 말하면, 현재 단계의 Computer Use는 “Mac mini 전용 에이전트 서버” 개념으로 접근하는 사람에게 맞습니다. 일상적으로 쓰는 메인 맥북에서 회의 중간에 켜두는 방식은 아직 불안정합니다. 기능이 “리서치 프리뷰”로 출시된 이유가 있습니다.
Q&A
마치며 — 총평
Claude Computer Use는 방향성이 맞습니다. AI가 “명령을 텍스트로 받는 것”을 넘어 “컴퓨터를 직접 쓰는 것”으로 넘어가는 흐름은 피할 수 없고, OSWorld 72.5%라는 수치도 16개월 만에 5배 가까이 오른 진짜 수치입니다.
다만 지금 당장 “AI가 내 Mac 전체를 대신 써준다”는 기대를 갖고 접근하면 실망할 가능성이 높습니다. 폴백 구조, macOS 전용, 스크린샷 기반의 태생적 느림, 보안 불확실성까지 — 리서치 프리뷰라는 이름에 걸맞은 단계입니다.
가장 현실적인 조언은, Mac mini 하나를 Claude 전용으로 따로 두고, 민감하지 않은 반복 자동화 작업부터 좁게 써보는 것입니다. 그 경험을 바탕으로 Anthropic이 정식 버전을 낼 때 제대로 활용하는 게 순서에 맞습니다.
- Anthropic 공식 블로그 — Dispatch and Computer Use (2026.03.23)
- Anthropic 공식 발표 — Acquires Vercept (2026.02)
- Anthropic 연구 문서 — Developing Computer Use (2024)
- Lifehacker — Claude Computer Use 실사용 리뷰 (2026.03.24)
- Unite.AI — Anthropic Brings Claude Desktop Control to Mac (2026.03.24)
- TechRadar — Put Claude to Work (2026.03.24)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Claude Computer Use는 리서치 프리뷰 단계이며, Anthropic의 정책 업데이트에 따라 기능·조건·지원 범위가 달라질 수 있습니다. 최신 정보는 공식 문서를 직접 확인하시기 바랍니다.

댓글 남기기