GPT-5.4 Computer Use, API 없으면 쓸 수 없습니다

Published on

in

GPT-5.4 Computer Use, API 없으면 쓸 수 없습니다
2026.03.05 출시 기준
GPT-5.4 기준
OpenAI 공식 문서 확인

GPT-5.4 Computer Use,
API 없으면 쓸 수 없습니다

ChatGPT Plus를 쓰고 있어도 Computer Use는 그림의 떡입니다. OpenAI가 공식 발표에서 전면에 내세운 기능인데, 정작 일반 사용자에게는 열려 있지 않습니다. 공식 문서를 직접 확인하고 정리했습니다.

75.0%
OSWorld 성공률
(인간 전문가 72.4%)
API 전용
ChatGPT UI에서
비제공
$5 이상
API Tier 1
최소 결제 조건
272K
토큰 초과 시
입력 요금 2배

GPT-5.4 Computer Use란 무엇인가

GPT-5.4 Computer Use는 AI가 직접 마우스를 클릭하고 키보드를 입력해 컴퓨터를 제어하는 기능입니다. 사람이 화면을 보고 앱을 다루는 것과 동일한 방식으로 작동하는데, GPT-5.4가 스크린샷을 분석하고 클릭·입력·스크롤 등 구체적인 행동 명령을 반환합니다.

OpenAI는 2026년 3월 5일 GPT-5.4를 공개하면서 이 기능을 발표 전면에 내세웠습니다. OSWorld-Verified 벤치마크에서 75.0% 성공률을 기록했고, 이는 인간 전문가 평균인 72.4%를 처음으로 넘어선 수치입니다. (출처: OpenAI 공식 블로그, 2026.03.05) 숫자만 보면 대단해 보이지만, 이 기능을 실제로 쓰려면 조건이 따릅니다.

GPT-5.4 Computer Use가 처음 공식 지원되는 범용 모델이라는 점에서 의미가 있습니다. 이전에는 Claude의 Computer Use나 별도 자동화 프레임워크를 써야 했지만, 이제 단일 모델로 코딩·추론·컴퓨터 제어를 한 번에 처리할 수 있게 됐습니다.

▲ 목차로 돌아가기

ChatGPT에서 쓸 수 없는 이유

💡 공식 발표문과 실제 접근 경로를 같이 놓고 보니 이런 차이가 보였습니다

OpenAI 공식 발표에는 이메일 작성·캘린더 예약 데모가 포함됐습니다. 그런데 정작 ChatGPT 인터페이스에는 이 기능이 없습니다. 공식 헬프센터 문서(GPT-5.3 and GPT-5.4 in ChatGPT)에는 Computer Use가 지원 도구 목록에 들어 있지 않습니다.

공식 문서에 이렇게 나와 있습니다: “In Codex and the API, GPT-5.4 is the first general-purpose model we’ve released with native, state-of-the-art computer-use capabilities.” (출처: openai.com/index/introducing-gpt-5-4/, 2026.03.05) ChatGPT라는 단어가 빠져 있습니다. Codex와 API만 명시돼 있습니다.

실제로 Reddit에서도 같은 혼란이 터져 나왔습니다. “ChatGPT에서 Computer Use를 찾을 수가 없다”는 질문에 돌아온 답변이 “API 통합이나 개발자 환경에서만 가능하다”는 내용이었습니다. (r/ChatGPT, 2026.03.06) ChatGPT Plus 구독만으로는 접근이 안 됩니다.

발표 시점에 일부 사용자가 Gmail 연동을 통해 받은 편지함 정리 기능을 사용할 수 있었지만, 이건 ChatGPT 에이전트 모드의 웹 브라우저 제어 기능이지 GPT-5.4의 네이티브 Computer Use와는 다른 접근 방식입니다. 화면 스크린샷을 직접 분석하고 마우스·키보드를 제어하는 방식이 Computer Use의 핵심인데, 이 부분은 ChatGPT UI에서 아직 열려 있지 않습니다.

▲ 목차로 돌아가기

API에서 실제로 작동하는 방식

진입 조건부터 확인해야 합니다

API에서 GPT-5.4 Computer Use를 쓰려면 먼저 Tier 1 이상의 API 계정이 필요합니다. 공식 문서에는 “minimum $5 prior spend”라고 나와 있습니다. (출처: developers.openai.com 가이드, 2026.03.11) ChatGPT 구독과 API는 완전히 별개의 계정 시스템이라 Plus 구독자라도 API 계정에 별도로 충전이 필요합니다.

작동 구조는 루프 형태입니다

코드 작성이 필요합니다. Python으로 직접 스크린샷을 캡처해 API에 전송하고, 돌아온 클릭·입력 명령을 PyAutoGUI로 실행하는 루프를 구성해야 합니다. 모델 자체가 마우스를 움직이는 게 아니라, 모델이 행동 명령을 생성하고 개발자의 코드가 그 명령을 실행하는 구조입니다. OpenAI는 공식 가이드에서 이 점을 명확히 합니다: “GPT-5.4 only sends action commands — your application decides whether to execute them.” (출처: nxcode.io GPT-5.4 Computer Use 가이드, 2026.03.11)

실제 비용은 생각보다 낮습니다. 스크린샷 10~20장 처리 기준으로 한 세션에 $0.10~$0.50 수준입니다. 입력 단가가 100만 토큰당 $2.50이기 때문에 단순 자동화 용도라면 부담이 크지 않습니다.

▲ 목차로 돌아가기

Pro가 오히려 낮게 나온 벤치마크

💡 OpenAI 공식 수치를 그대로 비교해봤더니 예상 밖의 패턴이 나왔습니다

GPT-5.4 Pro는 가격이 12배 비쌉니다. 그런데 일부 벤치마크에서는 표준 GPT-5.4보다 점수가 낮습니다.

OpenAI 공식 발표의 벤치마크 표를 보면 흥미로운 수치가 있습니다. GDPval(44개 직종에 걸친 전문 지식 업무 평가)에서 표준 GPT-5.4는 83.0%를 기록했는데, GPT-5.4 Pro는 82.0%로 1%포인트 낮습니다. (출처: openai.com/index/introducing-gpt-5-4/, 2026.03.05) 비용이 12배 더 비싸도 전문 업무에서는 표준 모델이 더 나온다는 뜻입니다.

같은 공식 표에서 Investment Banking Modeling Tasks(투자은행 실무 모델링)도 비슷한 패턴입니다. 표준 GPT-5.4가 87.3%인 반면 Pro는 83.6%입니다. OSWorld-Verified(컴퓨터 제어 성공률)는 표준 75.0%인데 Pro 수치는 공식 표에 아예 비어 있습니다. Pro가 Computer Use를 더 잘한다는 공식 데이터가 없습니다.

벤치마크 GPT-5.4 표준 GPT-5.4 Pro API 단가(입력)
GDPval (전문 업무) 83.0% 82.0% $2.50 vs $30 /M
IB Modeling (금융 모델링) 87.3% 83.6% $2.50 vs $30 /M
OSWorld (컴퓨터 제어) 75.0% 공식 미발표 $2.50 vs $30 /M
ARC-AGI-2 (추상 추론) 73.3% 83.3% $2.50 vs $30 /M

출처: OpenAI 공식 블로그 Benchmark 표 (openai.com/index/introducing-gpt-5-4/, 2026.03.05)

Pro가 유리한 구간은 명확합니다. ARC-AGI-2(추상 추론)에서는 Pro가 83.3%로 표준(73.3%)을 10%포인트 앞섭니다. FrontierMath(수학 연구)에서도 Pro가 의미 있게 앞서는 항목이 있습니다. 업무 자동화가 아닌 연구·수학·난도 높은 추론 작업이라면 Pro가 맞고, 일반 업무와 Computer Use는 표준으로 충분합니다.

▲ 목차로 돌아가기

272K 토큰이 넘으면 요금이 달라집니다

💡 공식 가격표에 숨어 있는 계단식 구조를 직접 계산해봤습니다

GPT-5.4의 1M 토큰 컨텍스트 창은 매력적인 기능이지만, 272K를 넘는 순간 입력 요금이 두 배로 올라갑니다.

공식 API 문서에는 이렇게 나와 있습니다: “We have separate standard pricing for requests under 272K and over 272K tokens.” (출처: developers.openai.com/api/docs/guides/latest-model, 2026.03.11) 구체적으로 표준 입력 단가는 100만 토큰당 $2.50인데, 272K를 초과하면 그 초과분에 대해 $5.00/M이 적용됩니다. 요금이 두 배입니다.

실제로 계산해보면 이렇습니다. 500K 토큰 요청 1건의 비용:

처음 272K 토큰: 272,000 × $2.50 / 1,000,000 = $0.68

초과 228K 토큰: 228,000 × $5.00 / 1,000,000 = $1.14

합계 = $1.82 (단순 계산 시 $1.25 대비 +46%)

코드베이스 전체를 컨텍스트에 넣으면 빠르게 이 기준을 넘깁니다. Computer Use는 스크린샷을 반복적으로 전송하는 구조라서 이미지 토큰이 누적됩니다. 세션이 길어질수록 실제 청구 금액이 예상보다 높아질 수 있습니다. 관련 가이드에서는 272K 아래로 유지할 수 있다면 구조를 조정해서 추가 비용을 피하라고 권고합니다. (출처: nxcode.io GPT-5.4 API Developer Guide, 2026.03.11)

1M 컨텍스트 창도 성능이 균일하지 않습니다. 공식 문서의 OpenAI MRCR v2 벤치마크 수치를 보면 512K~1M 구간에서 정확도가 36.6%까지 떨어집니다. 4K~8K 구간이 97.3%인 것과 비교하면 긴 컨텍스트에서는 품질이 크게 달라집니다. 중요한 정보는 앞쪽 200K 이내에 배치하는 게 실용적입니다.

▲ 목차로 돌아가기

실제로 쓸 수 있는 조건 요약

여기까지 정리한 내용을 상황별로 요약하면 이렇습니다.

상황 Computer Use 접근 비고
ChatGPT Free ❌ 불가 GPT-5.4 Thinking 자체도 제한
ChatGPT Plus ($20/월) ❌ 불가 ChatGPT UI에서 Computer Use 미제공
ChatGPT Pro ($200/월) ❌ 불가 ChatGPT UI 제한 동일 적용
OpenAI API (Tier 1+, $5 이상 결제) ✅ 가능 Python 코드 작성 필요
OpenAI Codex ✅ 가능 Playwright Interactive 스킬 포함

출처: OpenAI Help Center (GPT-5.3 and GPT-5.4 in ChatGPT), 2026.03.22 확인

솔직히 말하면, 이 기능은 현재 일반 사용자보다 개발자에게 열려 있습니다. 업무 자동화를 코드 없이 버튼 하나로 구현하고 싶다면 아직 기다려야 합니다. 반면 Python 환경을 세팅할 수 있고 API에 익숙하다면 지금 바로 쓸 수 있고, 세션당 비용도 생각보다 낮습니다.

ChatGPT 에이전트 모드에서 Gmail·캘린더 연동이 가능한 건 사실이지만, 그건 웹 기반 에이전트 흐름이고 네이티브 Computer Use와는 구현 방식이 다릅니다. 헷갈리기 쉬운 부분이라 OpenAI가 공개 발표에서 이 차이를 더 명확하게 설명했으면 하는 아쉬움이 있습니다.

▲ 목차로 돌아가기

Q&A

Q1. ChatGPT Plus에서 GPT-5.4 Thinking은 쓸 수 있나요?

네, 쓸 수 있습니다. GPT-5.4 Thinking은 Plus 구독자가 모델 선택기에서 직접 고를 수 있고, 주간 3,000 메시지까지 가능합니다. 단, 이 경우에도 Computer Use는 포함되지 않습니다. GPT-5.4 Thinking을 ChatGPT에서 쓰는 것과 API에서 Computer Use를 활성화하는 건 완전히 다른 경로입니다. (출처: OpenAI Help Center, 2026.03.22 확인)

Q2. OSWorld 75%가 인간을 넘겼다는데, 실제로 믿을 만한 수치인가요?

OSWorld-Verified는 실제 데스크톱 환경에서 스크린샷과 마우스·키보드 명령만으로 작업을 완료하는 비율을 측정하는 벤치마크입니다. 인간 전문가 기준치가 72.4%이고 GPT-5.4는 75.0%입니다. 다만 테스트 환경이 연구용 샌드박스이므로 실무 환경에서는 UI 변화, 예외 상황, 보안 정책 등 변수가 추가됩니다. 벤치마크 성적 자체는 신뢰할 만하지만 실사용 완성도와 같다고 보기는 어렵습니다. (출처: openai.com/index/introducing-gpt-5-4/, 2026.03.05)

Q3. API에서 Computer Use를 쓰면 내 화면이 OpenAI 서버에 업로드되나요?

네, 스크린샷을 base64 인코딩해서 API로 전송하는 구조입니다. 화면에 민감한 정보(은행 계좌, 개인정보, 비밀번호)가 표시된 상태에서는 사용하지 않는 게 좋습니다. OpenAI 공식 가이드에서도 “sensitive systems에서 비감독 실행 금지”를 권고합니다. (출처: nxcode.io GPT-5.4 Computer Use 가이드, 2026.03.11)

Q4. GPT-5.4 Pro는 언제 써야 하나요?

공식 벤치마크 기준으로 보면 ARC-AGI-2 같은 추상 추론, FrontierMath 같은 연구급 수학, 고난도 단일 요청 분석에서 Pro가 의미 있게 앞섭니다. 반면 일반 업무, 코딩, Computer Use 자동화에서는 표준 GPT-5.4가 비슷하거나 오히려 높은 점수를 냅니다. 비용이 12배 차이 나므로 표준으로 시작해서 특정 작업에서만 Pro로 교체하는 방식이 현실적입니다.

Q5. 1M 컨텍스트 창이 생기면 긴 코드베이스 분석이 항상 잘 될까요?

전체 코드를 넣을 수는 있지만 공식 문서의 MRCR 벤치마크를 보면 128K 구간까지는 86% 이상 정확도가 유지되다가, 512K~1M 구간에서는 36.6%까지 떨어집니다. 1M이라는 숫자보다 실제로 핵심 파일을 앞쪽 200K 안에 배치하는 전략이 더 중요합니다. (출처: developers.openai.com/api/docs/guides/latest-model, 2026.03.11)

▲ 목차로 돌아가기

마치며

GPT-5.4 Computer Use는 기술적으로 완성도 있는 기능입니다. OSWorld에서 인간 전문가를 처음 넘어섰고, 세션당 비용도 낮으며, Python 코드로 바로 시작할 수 있습니다. 그런데 ChatGPT UI에서는 쓸 수 없습니다. 이 사실 하나가 기대와 현실 사이의 가장 큰 간격입니다.

ChatGPT Plus에 월 $20을 내고 있어도, AI가 내 컴퓨터를 자동으로 조작하는 기능은 별도의 API 계정에 별도의 충전이 필요하고 코드를 직접 짜야 합니다. 이런 점을 공개 발표에서 더 명확하게 했더라면 혼란이 적었을 것 같습니다. 개발자라면 지금 바로 시작할 수 있고, 그렇지 않다면 ChatGPT 에이전트 모드가 추후 업데이트될 때를 기다리는 편이 현실적입니다.

한 가지 더 챙길 포인트는 Pro 모델 선택 기준입니다. 비용이 12배 비싸도 일부 벤치마크에서 표준이 앞서는 만큼, 자동화·코딩 목적이라면 표준 GPT-5.4가 더 합리적인 선택입니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. OpenAI 공식 블로그 — Introducing GPT-5.4
    https://openai.com/index/introducing-gpt-5-4/
  2. OpenAI Help Center — GPT-5.3 and GPT-5.4 in ChatGPT
    https://help.openai.com/en/articles/11909943-gpt-53-and-gpt-54-in-chatgpt
  3. OpenAI Developers — GPT-5.4 API Guide (Latest Model)
    https://developers.openai.com/api/docs/guides/latest-model
  4. NxCode — GPT-5.4 Computer Use AI Automate Desktop Tasks 2026
    https://www.nxcode.io/resources/news/gpt-5-4-computer-use-ai-automate-desktop-tasks-2026

본 포스팅은 2026년 3월 22일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI 공식 발표 내용은 출처 URL을 통해 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기