2026.03.21 작성
IT/AI
OpenAI Agents SDK, 쉽다는 말만 믿으면 막히는 게 있습니다
결론부터 말씀드리면, OpenAI Agents SDK는 진입 장벽이 낮은 건 사실입니다. 그런데 “OpenAI 전용 도구”라는 오해, “간단한 실험용”이라는 오해가 동시에 따라붙습니다. 두 가지 모두 틀렸고, 그 오해가 쌓이면 프로덕션에서 실제로 망가집니다. 공식 changelog와 비교 수치를 직접 뜯어봤습니다.
“OpenAI 전용”이라는 오해를 먼저 짚어야 합니다
OpenAI Agents SDK는 이름 때문에 “어차피 OpenAI 모델만 쓸 수 있겠지”라는 생각을 먼저 부릅니다. 막상 공식 문서를 열어보면 전혀 다른 내용이 나옵니다. SDK는 Chat Completions API 호환 방식으로 100개 이상의 외부 LLM을 지원합니다. Claude, Gemini, Llama 계열, LiteLLM을 통한 모든 모델까지 동일한 코드 구조로 연결됩니다. (출처: OpenAI Agents SDK 공식 문서 — openai.github.io/openai-agents-python, 2026.03 기준)
그러니까 “GPT만 써야 한다”는 이유로 이 SDK를 배제했다면, 선택지 하나를 공짜로 버린 겁니다. 다만 내장 트레이싱(Tracing)과 파인튜닝 도구는 OpenAI 플랫폼에 연동될 때 가장 잘 작동하는 건 맞습니다. 그 부분만 이해하고 쓰면 됩니다.
SDK 이름과 다르게, 멀티 모델 환경에서도 ModelSettings에 provider만 바꿔 주면 동일한 에이전트 코드가 그대로 돌아갑니다. 벤더 전환 비용이 사실상 설정 1줄입니다.
4가지 핵심 개념, 설계 철학이 담겨 있습니다
다른 에이전트 프레임워크들이 수십 개의 추상화 계층을 쌓을 때, OpenAI Agents SDK는 딱 4개만 씁니다. 이게 철학입니다. 많은 기능이 아니라 “배우기 쉬운 기본 개념 + 파이썬 그대로 활용”이 설계 원칙입니다. (출처: openai.github.io/openai-agents-python, 2026.03 기준)
지시문(instructions)과 도구(tools)를 가진 LLM 단위. 하나의 에이전트가 하나의 역할을 맡습니다.
한 에이전트가 처리 범위를 벗어나면 다른 에이전트에게 컨텍스트와 함께 위임합니다.
입력·출력을 에이전트 실행과 병렬로 검증합니다. 기준 미달 시 즉시 중단됩니다.
파이썬 함수 하나를 그대로 도구로 씁니다. 스키마 생성과 유효성 검사가 자동입니다.
전체 소스 코드가 약 2,000줄입니다. LangGraph의 방대한 구조와 비교하면 읽기가 훨씬 쉽습니다. 모르는 동작이 생기면 SDK 소스를 직접 열어보면 됩니다. 이게 “파이썬 퍼스트(Python-first)” 철학의 실제 의미입니다.
v0.10 이후로는 MCP 서버 도구 호출도 기본 지원됩니다. 즉, MCP 프로토콜로 연결된 외부 서비스(Supabase, Stripe, Gmail 등)를 에이전트가 Function Tool과 동일한 방식으로 호출할 수 있습니다.
v0.12.x에서 달라진 것들, 공식 changelog 직접 확인했습니다
2026년 3월 한 달만 봐도 버전이 4개 나왔습니다. v0.12.1(3.13), v0.12.2(3.14), v0.12.3(3.16), v0.12.4(3.18), v0.12.5(3.19). 출시 속도가 빠른 만큼 놓치기 쉬운 변경사항이 있습니다. (출처: github.com/openai/openai-agents-python/releases, 2026.03.19 기준)
| 버전 | 출시일 | 핵심 변경사항 |
|---|---|---|
| v0.12.5 | 2026.03.19 | MCP 취소 호출 오류 정규화, 스트리머블 HTTP MCP 재시도 수정 |
| v0.12.4 | 2026.03.18 | AdvancedSQLiteSession 커스텀 테이블명 버그 수정, jitter 지연 상한 캡 추가 |
| v0.12.3 | 2026.03.16 | 필터된 핸드오프 후속 처리 normalized 모드 추가 |
| v0.12.2 | 2026.03.14 | 멀티턴 재실행 중 고아 hosted shell 호출 제거 |
| v0.12.1 | 2026.03.13 | resume flow에서 명시적 승인 거절 메시지 보존 |
| v0.12.0 | 2026.03.12 | Opt-in 모델 재시도 정책(ModelSettings) 정식 도입 |
v0.12.0에서 가장 주목할 부분은 opt-in retry 정책입니다. 이전까지는 모델 API 호출이 실패하면 에이전트 런 자체가 멈췄습니다. 이제는 ModelSettings에 재시도 횟수와 지연 방식을 지정할 수 있습니다. 기본값은 재시도 없음(opt-in 방식)이라 기존 코드는 동작이 바뀌지 않습니다.
v0.12.4에서 jitter 지연 상한 캡이 추가됐습니다. 이전 버전에서는 재시도 지연이 무제한 증가할 수 있었습니다. 버전 고정 없이 pip install openai-agents로 최신 버전을 쓰면 이런 픽스가 자동 적용되지만, 동시에 다른 동작 변경이 섞여 들어올 수 있습니다.
다른 프레임워크와 수치로 비교하면 이렇게 달라집니다
2026년 3월 기준 주요 에이전트 프레임워크 5개를 수치로 나란히 놓으면 OpenAI Agents SDK의 포지션이 선명해집니다. (출처: letsdatascience.com/blog/ai-agent-frameworks-compared, 2026.03.07 기준)
| 프레임워크 | 최신 버전 | GitHub 스타 | 학습 곡선 | A2A 지원 | 적합한 상황 |
|---|---|---|---|---|---|
| OpenAI Agents SDK | 0.12.5 | 약 19K | 수 시간 | ❌ 미지원 | 빠른 프로토타이핑, 핸드오프 기반 위임 |
| LangGraph | 1.0.10 | 약 24.6K | 1~2주 | ✅ 지원 | 복잡한 상태 기반 워크플로, 체크포인팅 |
| CrewAI | 1.10.1 | 약 44.6K | 2~3일 | ✅ 지원 | 역할 기반 멀티에이전트, 빠른 팀 협업 구현 |
| Google ADK | 1.26.0 | 약 18K | 3~5일 | ✅ 지원 | 멀티모달 에이전트, Google Cloud 환경 |
| Claude Agent SDK | 0.1.48 | 약 8K | 2~3일 | ❌ 미지원 | MCP 인프로세스 연동, Anthropic 전용 |
수치가 말해주는 것은 이렇습니다. OpenAI Agents SDK는 학습 시간이 가장 짧고 소스가 가장 작지만, A2A(Agent-to-Agent) 프로토콜을 지원하지 않습니다. 2026년 현재 CrewAI, LangGraph, Google ADK 모두 A2A를 지원하고 있어, 조직 간 에이전트 통신이 필요한 구조에서는 선택지가 아닐 수 있습니다.
프로덕션에서 실제로 막히는 지점이 있습니다
“간단하다”는 말은 맞습니다. 그런데 그 단순함이 특정 상황에서 정확히 어떻게 발목을 잡는지는 잘 안 알려져 있습니다. 공식 문서와 실사용 사례를 교차해서 보면 이 지점이 보입니다.
LangGraph는 에이전트 실행 상태를 자동 저장합니다. 서버가 재시작되거나 중간에 실패해도 마지막 성공 지점에서 재개됩니다. OpenAI Agents SDK에는 이 기능이 없습니다. Sessions 기능이 v0.10에서 추가됐지만, 이건 단일 에이전트 루프 내 작업 컨텍스트 유지 수준입니다. 서버 재시작 후 복원은 직접 구현해야 합니다. (출처: openai.github.io/openai-agents-python/sessions, 2026.03 기준)
MCP는 에이전트-도구 연결 표준이고, A2A는 에이전트-에이전트 연결 표준입니다. CrewAI v1.10.1, LangGraph, Google ADK는 모두 A2A를 지원합니다. OpenAI Agents SDK는 공식 발표 없습니다. 에이전트가 다른 조직의 에이전트와 통신해야 하는 구조라면 현재 이 SDK 단독으로는 구현이 불가합니다.
이번 달에만 버전 4개가 나왔고, 각 버전마다 동작 수정이 포함되어 있습니다. v0.12.2에서 멀티턴 재실행 중 고아 호출 제거, v0.12.4에서 SQLite 세션 테이블명 버그 수정 같은 수정들입니다. 이 패턴에서 requirements.txt에 버전을 고정하지 않으면 CI/CD 파이프라인이 조용히 달라집니다.
이 세 가지는 홍보 자료나 입문 튜토리얼에 잘 안 나옵니다. 그런데 팀에서 실제로 배포할 때 가장 먼저 부딪히는 것들입니다.
이런 구조에서 쓰면 진짜 빠릅니다
약점을 파악했으면 강점이 터지는 구조도 알아야 합니다. OpenAI Agents SDK가 다른 프레임워크보다 유리한 상황은 꽤 구체적입니다.
분류 에이전트가 요청을 받아 전문 에이전트에게 넘기는 구조. 고객 문의 분류, 코드 리뷰 위임, 문서 요약 파이프라인 등이 딱 맞습니다. 30줄 미만 코드로 완성됩니다.
GPT와 Claude를 작업 유형에 따라 나눠 쓰고 싶을 때, ModelSettings provider 설정만 바꾸면 됩니다. 코드 재작성이 없습니다.
gpt-realtime-1.5 기반 음성 에이전트를 빌드할 때 자동 중단 감지, 컨텍스트 관리, 가드레일이 내장 지원됩니다. 음성 파이프라인용 별도 프레임워크를 찾을 필요가 없습니다.
v0.12.1에서 resume flow의 승인 거절 메시지 보존이 추가됐습니다. 사람이 중간에 검토하고 거절하는 워크플로에서 거절 이유가 이후 에이전트 실행에 유지됩니다. 실무 승인 게이트 구현이 가능합니다.
공식 문서의 “Python-first” 원칙과 Reddit 실사용자들의 피드백을 같이 놓으면 패턴이 나옵니다. “코드 구조를 이해하고 시작하는 팀”에게는 SDK가 맞고, “빠르게 자동화된 환경을 갖추고 싶은 팀”에게는 CrewAI나 OpenClaw가 먼저입니다. 숙련도에 따라 출발점이 달라야 합니다.
Q&A
마치며 — 총평
OpenAI Agents SDK는 에이전트 개발을 처음 시작하는 팀에게 지금도 가장 진입하기 쉬운 선택입니다. 소스 코드 2,000줄, 핵심 개념 4개, 설치 1줄. 이 단순함이 실제로 강점입니다.
그런데 “이름이 OpenAI라서 GPT만 된다”는 오해와 “단순하니까 실험용”이라는 오해 두 가지를 동시에 갖고 시작하면, 나중에 맞지 않는 도구를 억지로 쓰게 됩니다. 100개 이상의 LLM 지원, 실시간 음성 에이전트, Human-in-the-Loop는 실제로 있는 기능입니다. 반대로 체크포인팅 없음, A2A 미지원, 0.x 버전 안정성은 실제로 있는 제약입니다.
강점과 약점을 동시에 보고 나서 선택하는 게 맞습니다. 이 글이 그 판단에 실제로 도움이 됐으면 합니다.
📚 본 포스팅 참고 자료
- OpenAI Agents SDK 공식 문서 — openai.github.io/openai-agents-python
- OpenAI Agents SDK GitHub 릴리스 로그 — github.com/openai/openai-agents-python/releases
- OpenAI 에이전트 구축 공식 블로그 — openai.com/ko-KR/index/new-tools-for-building-agents
- AI Agent Frameworks Compared 2026 (Let’s Data Science) — letsdatascience.com/blog/ai-agent-frameworks-compared
본 포스팅은 2026년 3월 21일 / OpenAI Agents SDK v0.12.5 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 공식 최신 정보는 위 참고 자료 링크에서 직접 확인하시기 바랍니다.







댓글 남기기