GPT-5.4 Thinking 기준
OpenAI 공식 문서 확인
GPT-5.4 컴퓨터 조작, Plus면 다 되는 건 아닙니다
AI가 화면을 보고 마우스를 클릭한다는 말, 이미 많이 들으셨을 겁니다. GPT-5.4가 실제로 컴퓨터를 조작하는 기능을 탑재했고, 벤치마크 수치도 인간 기준선을 넘어섰습니다. 근데 직접 쓰려고 하면 막히는 조건이 있습니다. 결론부터 말씀드리면, 이 기능은 지금 ChatGPT 채팅창에서 쓸 수 없습니다.
GPT-5.4 컴퓨터 조작 기능, 벤치마크 수치가 의미하는 것
GPT-5.4는 2026년 3월 5일 공식 출시된 OpenAI의 최신 플래그십 모델입니다. 이번 모델에서 가장 화제가 된 부분은 단연 컴퓨터 조작(Computer Use) 기능입니다. AI가 화면을 보고 마우스를 클릭하고 키보드를 입력하는, 그러니까 사람이 컴퓨터 앞에 앉아 하는 일을 AI가 직접 하는 기능입니다.
공식 발표에서 OpenAI는 OSWorld 벤치마크 결과를 공개했는데, GPT-5.4 Thinking이 75.0%를 기록했습니다. 이 테스트에서 인간 기준선은 72.4%입니다. OpenAI 메인라인 모델로는 처음으로 인간 기준선을 넘어선 수치입니다. (출처: OpenAI 공식 발표, openai.com/index/introducing-gpt-5-4/)
비교를 위해 이전 모델인 GPT-5.2는 같은 테스트에서 47.3%였습니다. 한 세대 만에 거의 30%p 가까이 뛴 겁니다. 단순 수치 이상으로, 실제 업무 환경에서 AI가 앱을 열고 버튼을 누르고 데이터를 정리하는 루프를 스스로 돌릴 수 있다는 의미입니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다 — 75.0%라는 수치 자체보다, 이 기능이 어떤 경로에서만 쓸 수 있는지가 실제 사용자 입장에서는 더 중요한 정보입니다.
채팅창에서 쓸 수 없는 이유 — 공식 문서에 딱 이렇게 나옵니다
GPT-5.4 컴퓨터 조작 기능에 관한 기사나 유튜브 영상 대부분이 “이제 AI가 컴퓨터를 조작할 수 있다”는 내용으로 채워져 있습니다. 근데 막상 ChatGPT를 열고 써보면 이 기능이 보이지 않습니다.
이유는 간단합니다. OpenAI 공식 Help Center 문서를 보면, 컴퓨터 조작 기능은 API와 Codex에서만 지원됩니다. ChatGPT 일반 대화창에서는 현재 사용할 수 없습니다. 브런치의 GPT-5.4 분석 글에도 “컴퓨터 사용 기능은 현재 API와 Codex에서만 지원되며, ChatGPT 일반 대화에서는 아직 사용할 수 없습니다”라고 명확히 적혀 있습니다. (출처: brunch.co.kr/@sungdairi/68, 2026.03)
즉, 월 29,000원 Plus를 구독하거나 월 299,000원 Pro를 내도, ChatGPT 채팅 인터페이스에서 AI가 마우스를 클릭하는 장면은 볼 수 없습니다. 이 기능은 OpenAI API를 직접 호출하거나, 코딩 에이전트인 Codex CLI를 통해야 접근할 수 있습니다.
💡 이 기능을 소개하는 글들이 많은데, API 사용 경험이 없다면 지금 당장 써볼 수 있는 기능이 아닙니다. ChatGPT 계정만 있는 일반 사용자와 API 개발자는 접근 경로가 완전히 다릅니다.
요금제별로 실제 쓸 수 있는 것과 없는 것
GPT-5.4가 출시되면서 ChatGPT 모델 선택 화면에는 세 가지 티어가 생겼습니다: Instant(5.3), Thinking(5.4), Pro(5.4). 이걸 어떤 요금제에서 쓸 수 있는지를 공식 Help Center 문서를 기준으로 정리하면 아래와 같습니다. (출처: help.openai.com/en/articles/11909943)
| 요금제 | Instant 5.3 | Thinking 5.4 | Pro 5.4 |
|---|---|---|---|
| Free | ✅ (5시간마다 10회) | ❌ | ❌ |
| Go (월 13,000원) | ✅ (3시간마다 160회) | ⚠️ (5시간마다 10회) | ❌ |
| Plus (월 29,000원) | ✅ (3시간마다 160회) | ✅ (주 3,000회) | ❌ |
| Pro (월 299,000원) | ✅ | ✅ (무제한) | ✅ (무제한) |
Go 요금제는 Thinking을 쓸 수 있지만, ‘+’ 아이콘을 눌러 ‘잘 생각하기’ 옵션을 직접 켜야 합니다. 자동으로 적용되는 게 아닙니다. Plus는 주당 3,000회 한도가 있지만, 이건 생각보다 여유 있는 수준입니다. 하루 평균 420회 이상 Thinking을 직접 켜서 써야 한도에 닿습니다.
한 가지 주의할 점은 컨텍스트 창 크기도 요금제에 따라 다르다는 것입니다. Instant 5.3 기준으로 Free는 16K 토큰, Plus는 32K, Pro는 128K입니다. Thinking 5.4는 모든 유료 플랜에서 256K(128K 입력 + 128K 출력)이고, Pro 티어에서는 400K(272K 입력 + 128K 출력)까지 올라갑니다.
월 29만 원 Pro인데 오히려 기능이 빠집니다
Pro 요금제는 월 299,000원입니다. Plus보다 10배 비쌉니다. 그런데 OpenAI 공식 Help Center 문서에는 Pro 5.4를 선택했을 때 일부 기능이 비활성화된다는 내용이 명확히 적혀 있습니다.
공식 문서의 해당 문장은 이렇습니다: “Apps, Memory, Canvas, and image generation are not available with Pro.” (출처: help.openai.com/en/articles/11909943, 2026.03 기준)
Pro 5.4 선택 시 비활성화되는 기능
- 앱(Apps) 연동
- 메모리(Memory) — 대화 기억 기능
- 캔버스(Canvas) — 문서·코드 편집 인터페이스
- 이미지 생성(Image generation)
이유는 Pro 5.4가 워낙 컴퓨팅 집약적인 추론을 돌리기 때문에, 동시에 다른 기능까지 처리하는 구조가 현재 지원되지 않는다는 설명입니다. 공식 문서에서 별도 해소 일정을 밝히지 않았습니다.
실생활에서 메모리 기능을 켜놓고 쓰거나, Canvas로 문서를 편집하면서 쓰는 패턴이라면 Pro로 전환했을 때 오히려 불편해질 수 있습니다. 브런치에 올라온 GPT-5.4 Pro 일반인 후기에서도 “STEM이나 업무 관련 용도가 아니라면 30만 원 요금제가 막상 쓸만하지는 않았다”는 평가가 나왔습니다. (출처: brunch.co.kr/@proxima-b/79, 2026.03.13)
💡 Pro 요금제 전환을 고민 중이라면, 메모리와 캔버스를 얼마나 자주 쓰는지를 먼저 확인해보는 게 좋습니다. Plus의 Thinking 5.4로 일상 업무는 충분히 커버되는 경우가 많습니다.
Plus Thinking 한도 3,000개, 자동 라우팅과 분리된다는 것
Plus 요금제에서 GPT-5.4 Thinking의 주간 한도는 3,000회입니다. 그런데 여기서 한 가지 흥미로운 구조가 있습니다. 이 3,000회는 모델 선택기에서 Thinking을 직접 선택했을 때만 차감됩니다.
ChatGPT가 Instant(5.3)를 쓰다가 질문의 복잡도를 감지해서 자동으로 Thinking(5.4)으로 전환하는 경우가 있습니다. 이 자동 라우팅으로 Thinking이 실행된 건 3,000회 한도에서 빠지지 않습니다. 공식 문서에 이렇게 나옵니다: “Automatic switching from GPT-5.3 Instant to GPT-5.4 Thinking does not count toward this weekly limit.” (출처: help.openai.com/en/articles/11909943)
주간 한도를 다 써도 ChatGPT 시스템이 판단해서 Thinking으로 자동 전환하는 경우는 여전히 작동합니다. 즉, 한도가 끝났다고 Thinking 기능이 완전히 막히는 게 아닙니다. 차이는 내가 직접 “Thinking 모드로 답해줘”를 선택할 수 없게 된다는 점입니다.
| 구분 | 한도 차감 여부 | 비고 |
|---|---|---|
| 모델 선택기에서 직접 Thinking 선택 | 차감 O | 주 3,000회 소모 |
| Instant → Thinking 자동 라우팅 | 차감 X | 한도 초과 후에도 작동 |
Plus로 하루 평균 100회 정도 Thinking을 직접 써야 주간 한도(3,000회)에 닿습니다. 일반적인 사용 패턴에서는 한도보다 훨씬 적게 씁니다. 단, 긴 코딩 작업이나 심층 리서치를 하루에 여러 건 집중적으로 돌리는 경우에는 달라질 수 있습니다.
실제로 컴퓨터 조작 기능을 쓰려면 필요한 것들
컴퓨터 조작 기능을 써보고 싶다면 두 가지 경로가 있습니다. 하나는 OpenAI API, 다른 하나는 Codex CLI입니다. 둘 다 별도 설정이 필요합니다.
API 경로
API에서 컴퓨터 조작 기능은 gpt-5.4 모델과 Responses API(/v1/responses)를 조합해서 씁니다. 기존의 Chat Completions API(/v1/chat/completions)로는 gpt-5.4-pro가 지원되지 않습니다. (출처: OpenAI API 문서, developers.openai.com)
tools 파라미터에 {"type": "computer_use"}를 넣는 방식입니다. API 비용은 입력 토큰당 $2.50/M, 출력 $15/M입니다. 단, 272K 토큰을 초과하면 해당 구간부터 단가가 2배로 올라갑니다. (출처: openai.com/api/pricing/, 2026.03.06 기준)
Codex CLI 경로
Codex CLI는 터미널에서 AI에게 코딩 작업을 위임하는 OpenAI의 명령줄 도구입니다. GPT-5.4의 build-run-verify-fix 루프가 여기서 작동합니다. 코드를 쓰고, 실행해보고, 결과를 확인하고, 오류가 있으면 스스로 고치는 사이클을 자동으로 돌립니다. 단, 이 경로도 API 키와 기술적 설정이 필요합니다.
💡 API 경험이 없는 일반 사용자라면 지금 당장 컴퓨터 조작 기능을 쓰기는 어렵습니다. ChatGPT 채팅창에서 이 기능이 열릴 때까지 기다리거나, API 기초부터 시작하는 게 현실적인 선택입니다.
GPT-5.4 Thinking vs Pro, 이 경우엔 Thinking이 앞섭니다
GPT-5.4에는 같은 모델을 기반으로 한 두 가지 티어가 있습니다. Thinking(월 29,000원 Plus로 접근 가능)과 Pro(월 299,000원 Pro 전용)입니다. 당연히 더 비싼 Pro가 모든 면에서 앞설 것 같지만, 공식 발표 벤치마크를 보면 그렇지 않은 케이스가 있습니다.
GDPval 벤치마크는 44개 화이트칼라 직종(회계, 법무, 마케팅 등)에서 실제 지식 업무 능력을 평가합니다. 여기서 Thinking 5.4는 83.0%를 기록했고, Pro 5.4는 82.0%였습니다. 10배 비싼 Pro가 1%p 뒤집니다. (출처: OpenAI 공식 발표, openai.com/index/introducing-gpt-5-4/)
| 벤치마크 | Thinking 5.4 | Pro 5.4 | 유리한 케이스 |
|---|---|---|---|
| GDPval (일상 지식업무) | 83.0% ✓ | 82.0% | Thinking |
| ARC-AGI-2 (추상 추론) | 73.3% | 83.3% ✓ | Pro |
| BrowseComp (심층 웹 리서치) | 82.7% | 89.3% ✓ | Pro |
| OSWorld (컴퓨터 조작) | 75.0% ✓ | 미공개 | Thinking (비교 불가) |
Pro가 앞서는 영역은 분명 있습니다. 복잡한 추상 추론(ARC-AGI-2: 83.3%)이나 다수 소스를 종합하는 심층 웹 리서치(BrowseComp: 89.3%)에서는 Pro의 컴퓨팅 예산 무제한이 효과를 냅니다. 반면 일상적인 업무, 문서 작업, 코딩 지원에서는 Thinking으로 충분합니다.
Pro를 써야 하는 경우는 생각보다 좁습니다. 법률·금융 문서처럼 오류 비용이 극히 높은 전문 업무, 또는 수십 개 소스를 연결해야 하는 프론티어급 리서치 작업이 아니라면, Plus의 Thinking 5.4가 훨씬 합리적인 선택입니다.
💡 Pro가 Thinking보다 무조건 낫다는 전제로 업그레이드를 고민하고 있다면, 본인 실제 업무가 ARC-AGI-2 수준의 추상 추론이나 수십 개 소스 리서치에 해당하는지를 먼저 따져보는 게 맞습니다.
Q&A
마치며
GPT-5.4는 분명 눈에 띄는 모델입니다. 컴퓨터 조작 기능이 인간 기준선을 처음 넘어섰고, 일상 업무 벤치마크(GDPval 83%)도 인상적입니다. 하지만 기사나 영상에서 소개된 기능 전체가 지금 당장 내 ChatGPT에서 쓸 수 있는 건 아닙니다.
컴퓨터 조작은 API·Codex 전용입니다. Pro 5.4는 메모리·캔버스·이미지 생성이 꺼집니다. GDPval 기준으로 Plus Thinking이 Pro보다 1%p 높습니다. Plus에서 Thinking을 주간 3,000회 쓰되, 자동 라우팅은 한도에서 빠집니다. 이 네 가지만 알고 있어도 GPT-5.4에 관한 잘못된 기대를 피할 수 있습니다.
솔직히 말하면, 일반적인 업무나 글쓰기 용도라면 Plus Thinking 5.4로 충분합니다. Pro 업그레이드가 진짜 필요한 케이스는 생각보다 적습니다. ChatGPT 대화창에서 AI가 마우스를 클릭하는 날은 아직 오지 않았습니다.
본 포스팅 참고 자료
- OpenAI Help Center — GPT-5.3 and GPT-5.4 in ChatGPT: help.openai.com/en/articles/11909943
- OpenAI 공식 발표 — Introducing GPT-5.4: openai.com/index/introducing-gpt-5-4/
- OpenAI API 요금 (2026.03.06 기준): openai.com/api/pricing/
- 나무위키 GPT-5 문서 (커뮤니티 수집 기록): namu.wiki/w/GPT-5
본 포스팅은 2026년 3월 30일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. IT/AI 서비스 특성상 업데이트로 내용이 달라질 수 있으므로, 중요한 의사결정 전에는 OpenAI 공식 사이트에서 최신 정보를 직접 확인하시기 바랍니다. 본 포스팅의 수치와 정보는 공식 발표 기준이며, 개인적 사용 환경에 따라 실제 경험이 다를 수 있습니다.











댓글 남기기