2026.03.11 발표 기준 / GPT-5.2 이상 모델 기준

Responses API 컴퓨터 환경, 핵심 4가지 직접 확인했습니다

OpenAI가 2026년 3월 11일 Responses API에 컴퓨터 환경을 얹었습니다. 셸 도구, 호스팅 컨테이너, 에이전트 스킬, 컨텍스트 컴팩션 — 이 4개가 한꺼번에 발표됐는데, 솔직히 말하면 기대했던 것과 달랐습니다. “모델이 명령을 실행한다”는 말이 반은 맞고 반은 틀립니다.

셸 도구 Go·Java·Node 지원
호스팅 컨테이너 격리 실행
에이전트 스킬 재사용
네이티브 컴팩션 지원

Responses API에 컴퓨터 환경이 붙으면 뭐가 달라지나요

Responses API는 2025년 3월 처음 나왔습니다. 기존 Chat Completions API와 Assistants API의 장점을 하나로 합친 형태인데, 출시 1년이 된 2026년 3월 11일 OpenAI가 “컴퓨터 환경”을 정식으로 얹었습니다. (출처: OpenAI 공식 블로그, 2026.03.11)

핵심 발상은 이겁니다. 프롬프트만으로 모델을 쓰면 모델이 학습한 지식 범위 내에서만 작동합니다. 그런데 모델에게 “컴퓨터 환경”을 주면, 실제 API를 호출하거나 파일을 만들거나 데이터베이스를 조회하는 식의 실세계 작업이 가능해집니다. 가능성의 범위가 다릅니다.

이번에 묶인 구성요소는 4가지입니다. 셸 도구(Shell Tool), 호스팅 컨테이너(Hosted Container), 에이전트 스킬(Agent Skills), 네이티브 컨텍스트 컴팩션(Context Compaction)입니다. 각각이 독립적으로도 쓸 수 있지만, 함께 쓸 때 진짜 에이전트 워크플로가 완성됩니다.

▲ 목차로 돌아가기

셸 도구: Python만 됐던 게 왜 문제였나

기존 코드 인터프리터의 한계

OpenAI의 기존 코드 인터프리터는 Python만 실행할 수 있었습니다. 에이전트가 Go 서버를 띄우거나 Node.js 스크립트를 돌리거나 Java 프로그램을 빌드해야 하는 상황에서는 그냥 막혔습니다. 실무에서 파이썬만 쓰는 팀은 많지 않습니다.

이번에 달라진 것

새로운 셸 도구는 Unix 커맨드라인을 통째로 씁니다. grep, curl, awk는 기본이고, Go·Java·Node.js 실행, 서버 구동까지 가능합니다. (출처: OpenAI 공식 블로그, 2026.03.11) 이게 의미하는 건 간단합니다. 에이전트가 쓸 수 있는 언어와 도구의 폭이 사실상 시스템 수준으로 넓어졌습니다.

💡 공식 문서와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
셸 도구의 진짜 가치는 “언어 다양성”보다 에이전트가 여러 명령을 동시에(병렬로) 실행할 수 있다는 점입니다. 파일 검색, 외부 API 호출, 중간 결과 검증을 별도 컨테이너 세션에서 동시에 돌릴 수 있어서, 순차 실행 대비 처리 속도가 의미 있게 달라집니다.

다만 출력 크기에는 상한이 있습니다. 명령당 출력 한도를 모델이 직접 지정하고 Responses API가 이를 강제합니다. 예를 들어 1,000자 상한을 걸면 처음과 끝 부분은 보존하고 중간이 잘리며 “N자 생략됨” 표시가 붙습니다. 컨텍스트 낭비를 막는 구조인데, 반대로 말하면 중간 로그가 필요한 디버깅 상황에서는 불편할 수 있습니다.

▲ 목차로 돌아가기

“모델이 명령을 실행한다”는 말, 절반은 틀렸습니다

실제 작동 구조

OpenAI 공식 발표문에 딱 이렇게 나옵니다. “모델은 도구 호출을 제안할 수 있을 뿐, 직접 실행할 수는 없습니다(the model actually only proposes a tool call. It can’t execute the call on its own).” (출처: OpenAI 공식 블로그, 2026.03.11) 실행은 Responses API 서비스가 담당합니다.

💡 이 구조가 뒤집어 보면 이렇습니다.
모델이 “직접 실행 못 한다”는 게 사실 보안 설계의 핵심입니다. 모델이 악의적인 명령을 제안하더라도, 실행 전 Responses API 레이어가 정책을 적용합니다. 그런데 동시에 이 구조가 프롬프트 인젝션 공격의 경로가 되기도 합니다. 모델이 외부 콘텐츠(웹페이지, 이메일 등)를 읽다가 악의적인 명령을 제안하도록 조작당하면, Responses API는 그 명령을 실행합니다. 모델이 직접 실행하지 않는다는 게 완전한 방어막이 아닙니다.

GPT-5.2 이상에서만 작동합니다

셸 명령을 제안하려면 모델이 이 방식으로 훈련되어 있어야 합니다. 공식 문서에 따르면 GPT-5.2 이상 모델만 셸 도구를 제안하도록 훈련되어 있습니다. (출처: OpenAI 공식 블로그, 2026.03.11) 이전 버전 모델을 쓰는 환경이라면 이 기능은 쓸 수 없습니다. 단순 업데이트가 아니라 모델 교체가 필요합니다.

▲ 목차로 돌아가기

호스팅 컨테이너, 편하지만 이 조건이 걸립니다

컨테이너가 모델의 작업 공간이 됩니다

호스팅 컨테이너는 파일 시스템, 데이터베이스(SQLite), 네트워크 접근 세 가지를 제공합니다. 스프레드시트를 통째로 프롬프트에 붙여 넣는 대신, 컨테이너에 올려두고 모델이 셸로 필요한 행만 조회하는 방식입니다. 컨텍스트 비용도 줄고 대용량 데이터 처리도 현실적으로 가능해집니다. (출처: OpenAI 공식 블로그, 2026.03.11)

네트워크는 열리지만 통제됩니다

컨테이너는 기본적으로 외부 인터넷에 연결되지 않습니다. 라이브러리 설치나 외부 API 호출이 필요한 경우에는 “이그레스 프록시(egress proxy)”를 통해 허용된 도메인으로만 트래픽이 나갑니다. API 키 같은 자격증명은 컨테이너 내부에 저장되지 않고 플레이스홀더 형태로 주입됩니다. 모델은 실제 키 값을 볼 수 없습니다.

💡 이 구조를 실제 보안 흐름과 함께 놓고 보면 이렇습니다.
자격증명이 플레이스홀더로 처리된다는 건, 모델이 프롬프트 인젝션에 걸려도 실제 API 키를 외부로 빼내기 어렵다는 뜻입니다. 그런데 동시에 허용된 도메인 목록 설정을 잘못 하면, 정상처럼 보이는 외부 요청이 민감한 내부 데이터를 실어 나를 수 있습니다. 설정 책임이 개발자에게 있습니다.

데이터 주권 이슈: 유럽 기업은 추가 검토 필요

호스팅 컨테이너는 OpenAI 인프라에서 돌아갑니다. EU 기업이라면 GDPR 및 EU AI 법(고위험 AI 시스템 분류 포함)과의 충돌 여부를 먼저 확인해야 합니다. 자체 인프라를 쓰는 자체 실행 환경 대비 제어권이 줄어드는 트레이드오프가 있습니다. 이 부분에 대해 OpenAI는 공식 답변을 내놓지 않은 상태입니다.

▲ 목차로 돌아가기

에이전트 스킬과 컴팩션, 실제로 무슨 차이를 만드나

스킬: “매번 재발견”하는 비효율을 잡아줍니다

에이전트 워크플로가 반복될 때마다 모델이 처음부터 “어떤 명령을 써야 하지?”를 재학습하는 식으로 작동하면 결과가 매번 조금씩 달라지고 비용도 낭비됩니다. 스킬(Skills)은 이 패턴을 폴더 번들로 패키징합니다. SKILL.md 파일에 메타데이터와 지침을 담고, Responses API가 프롬프트 전달 전에 자동으로 이 스킬을 컨텍스트에 포함시킵니다. (출처: OpenAI 공식 블로그, 2026.03.11)

스킬은 API로 버전 관리가 됩니다. ID로 호출하고, 업데이트하고, 롤백할 수 있습니다. 워크플로 재현성이 높아지는 구조입니다.

컴팩션: 장시간 작업에서 컨텍스트가 버텨줍니다

에이전트가 오래 돌수록 컨텍스트 윈도우가 꽉 찹니다. OpenAI는 네이티브 컴팩션으로 이 문제를 처리합니다. 모델이 이전 대화 상태를 분석해 핵심만 담은 압축본(암호화된 토큰 효율 표현)을 생성하고, 다음 컨텍스트 윈도우는 이 압축본과 직전 고가치 내용으로만 채워집니다. Codex가 장시간 코딩 세션을 끊기지 않고 진행할 수 있는 게 이 컴팩션 덕분입니다. (출처: OpenAI 공식 블로그, 2026.03.11)

💡 같은 날 공개된 다른 자료와 교차해서 보니 이런 게 보였습니다.
컴팩션 알고리즘은 모델 훈련과 함께 진화합니다. 즉, OpenAI 모델이 업데이트될수록 컴팩션 품질도 자동으로 올라갑니다. 개발자가 따로 컴팩션 로직을 유지보수할 필요가 없습니다. 반대로, 컴팩션이 무엇을 “핵심”으로 볼지는 OpenAI가 결정합니다. 어떤 중간 단계 정보가 날아갔는지 개발자가 직접 제어할 수 없습니다.

서버사이드 컴팩션은 임계값을 설정하면 자동으로 트리거됩니다. /compact 엔드포인트로 수동 호출도 가능합니다. 컨텍스트 한도를 약간 초과하더라도 거절 대신 컴팩션 후 처리하는 버퍼도 내장되어 있습니다.

▲ 목차로 돌아가기

Perplexity Sandbox API와 같은 날 공개된 이유

2026년 3월 11일은 하루에 너무 많은 것이 나왔습니다

OpenAI Responses API 컴퓨터 환경 발표와 같은 날, Perplexity도 Sandbox API를 공개했습니다. Python·JavaScript·SQL 격리 실행, 세션 간 파일 지속, 장시간 워크플로 일시정지·재개를 지원하는 구조입니다. 네트워크 접근은 없고 아웃바운드 트래픽은 프록시로만 허용되며 코드가 원시 API 키에 접근 불가하다는 보안 설계도 OpenAI와 거의 동일합니다. (출처: jls42.org, 2026.03.11 기준 원문 분석)

항목	OpenAI Responses API	Perplexity Sandbox API
실행 언어	Unix 셸 전반 (Go, Java, Node 포함)	Python, JavaScript, SQL
파일 지속성	컨테이너 파일 시스템	마운트된 퍼시스턴트 파일 시스템
네트워크 접근	허용 목록 기반 이그레스 프록시	직접 접근 없음, 프록시만
자격증명	도메인 범위 플레이스홀더 주입	원시 API 키 접근 차단
현재 상태	GPT-5.2 이상 모델 공개 이용	비공개 베타 (이용 대기 중)

같은 날 비슷한 구조가 두 곳에서 나왔다는 건, 이 방향이 업계 표준이 되고 있다는 신호입니다. 에이전트에게 격리된 실행 환경을 주고, 자격증명은 모델 밖에서 관리하고, 네트워크는 허용 목록 기반으로 열어주는 패턴입니다.

여전히 남아있는 질문

엔터프라이즈 관점에서 실질적인 도전 과제는 허용 목록 관리입니다. 실무 에이전트는 수십 개의 외부 서비스를 호출할 수 있는데, 매 서비스마다 허용 도메인을 등록하고 유지보수하는 운영 부담은 개발팀에 고스란히 넘어옵니다. 이 부분을 어떻게 자동화하거나 단순화할지는 아직 공개된 내용이 없습니다.

▲ 목차로 돌아가기

Q&A

Q1. Responses API 컴퓨터 환경은 지금 당장 쓸 수 있나요?

셸 도구와 호스팅 컨테이너는 GPT-5.2 이상 모델을 기준으로 공개되어 있습니다. 다만 Perplexity Sandbox API처럼 일부 기능은 아직 베타 단계인 서비스도 있으니, 사용하려는 구체적인 기능이 현재 어떤 상태인지 OpenAI 개발자 플랫폼 공식 문서에서 확인하는 게 빠릅니다.

Q2. 모델이 명령을 직접 실행하지 않는다면, 보안은 완전히 해결된 건가요?

그렇지 않습니다. 모델이 외부 콘텐츠(이메일, 웹페이지 등)를 처리하다가 악의적인 명령을 “제안”하도록 조작당하면, Responses API는 그 명령을 실행합니다. OpenAI도 같은 날 프롬프트 인젝션 방어 전략에 대한 별도 공식 문서를 발표했습니다. 허용 도메인 목록 설정과 최소 권한 원칙 적용이 개발자 몫입니다.

Q3. 기존 Assistants API를 쓰고 있다면 언제까지 마이그레이션해야 하나요?

Assistants API는 더 이상 신규 기능이 추가되지 않으며, 2026년 8월 26일에 서비스가 종료됩니다. (출처: Microsoft Azure Foundry 공식 문서) Responses API로의 마이그레이션 가이드는 OpenAI 공식 문서에 별도로 제공됩니다.

Q4. 에이전트 스킬은 직접 만들어야 하나요, 아니면 기성 스킬을 가져다 쓸 수 있나요?

OpenAI는 agentskills.io를 통해 스킬 공유 생태계를 운영하고 있습니다. SKILL.md 파일과 지원 리소스로 구성된 폴더 번들 형태여서, 직접 만들거나 공개된 스킬을 가져다 쓸 수 있습니다. 버전 관리는 API로 됩니다. 어떤 스킬이 현재 공개되어 있는지는 OpenAI 커뮤니티 포럼에서 확인 가능하지만, 공식 목록 페이지는 아직 별도로 공개되지 않았습니다.

Q5. 컨텍스트 컴팩션이 자동으로 되면 중간 과정을 추적하기 어려워지지 않나요?

맞습니다. 서버사이드 컴팩션이 켜진 상태에서는 어떤 중간 단계 정보가 압축됐는지 개발자가 직접 제어하기 어렵습니다. /compact 엔드포인트로 수동 호출하면 타이밍을 직접 잡을 수 있지만, 무엇이 “핵심”으로 분류되는지의 기준은 OpenAI 모델 훈련에 달려 있습니다. 감사 로그가 중요한 규제 환경에서는 별도 로깅 레이어를 추가하는 게 권장됩니다.

▲ 목차로 돌아가기

마치며 — 생각보다 간단하지 않고, 그래서 더 주목해야 합니다

Responses API 컴퓨터 환경은 “AI가 이제 컴퓨터를 쓴다”는 말로 요약되기 쉽습니다. 실제로는 더 세밀합니다. 모델은 제안만 하고, 실행은 플랫폼이 하고, 보안은 개발자가 허용 목록을 관리해야 하고, 컴팩션은 무엇을 기억할지를 OpenAI가 결정합니다. 편의성과 제어권의 교환입니다.

이 구조가 흥미로운 건, 같은 날 Perplexity가 거의 동일한 설계로 Sandbox API를 공개했기 때문입니다. 우연이라기보다, 에이전트 인프라의 표준 패턴이 수렴하고 있다는 증거에 가깝습니다. 격리된 실행, 자격증명 분리, 허용 목록 기반 네트워크 — 이 세 가지는 앞으로 모든 에이전트 플랫폼의 기본값이 될 가능성이 높습니다.

Assistants API 종료 일정(2026.08.26)을 감안하면 지금이 마이그레이션 검토를 시작하기 딱 좋은 시점입니다. 새로운 기능을 쓰기 위해서가 아니라, 서비스가 끊기지 않으려면 움직여야 하는 시점이 이미 가까워져 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

OpenAI 공식 블로그 — From model to agent: Equipping the Responses API with a computer environment
https://openai.com/index/equip-responses-api-computer-environment/
OpenAI 개발자 플랫폼 — Responses API 마이그레이션 가이드
https://developers.openai.com/api/docs/guides/migrate-to-responses
InfoQ — OpenAI Extends the Responses API to Serve as a Foundation for Reliable Agents (2026.03)
https://www.infoq.com/news/2026/03/openai-responses-api-agents/
Microsoft Azure Foundry — Assistants API 종료 일정 (2026.08.26)
https://learn.microsoft.com/ko-kr/azure/foundry-classic/openai/concepts/assistants
jls42.org — AI 뉴스 2026.03.11 요약 (Perplexity Sandbox API 포함)
https://jls42.org/en/news/ia-actualites-11-mar-2026

※ 본 포스팅은 2026년 4월 2일 기준으로 작성되었으며, OpenAI 공식 발표 자료(2026.03.11)를 바탕으로 합니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 정확한 사양과 가용 여부는 OpenAI 개발자 플랫폼 공식 문서에서 최신 정보를 확인하시기 바랍니다.

Responses API 컴퓨터 환경, 핵심 4가지 직접 확인했습니다

Responses API에 컴퓨터 환경이 붙으면 뭐가 달라지나요