OpenAI Responses API 기준
⚠ D-156 종료 예정
Assistants API 종료,
공식 문서로 4가지 확인했습니다
OpenAI가 공식 문서에 딱 이렇게 써놨습니다. “Assistants API는 2026년 8월 26일에 종료됩니다.” 지금 Assistants API 기반으로 서비스를 운영 중이라면, 남은 시간이 156일입니다. 그리고 막상 마이그레이션 가이드를 열어보면 “생각보다 간단하지 않다”는 걸 바로 느끼게 됩니다.
Assistants API 종료 — 공식 타임라인 정리
OpenAI 공식 문서에 이미 종료 선언이 올라가 있습니다. 2025년 8월 26일에 deprecated(지원 중단) 공지가 났고, 정확히 1년 뒤인 2026년 8월 26일에 API 자체가 꺼집니다. (출처: OpenAI platform.openai.com/docs/assistants/migration) 오늘 기준으로 156일 남았습니다.
OpenAI가 이렇게 빠르게 결정을 내린 건 Responses API가 기능 패리티(feature parity)를 달성했다고 판단했기 때문입니다. 공식 발표문에는 “Responses API는 이미 Chat Completions를 토큰 활동량에서 추월했다”고 직접 나와 있습니다. 수치로는 Responses API 내부 테스트에서 캐시 활용 효율이 Chat Completions 대비 40%~80% 개선됐다고 명시되어 있습니다.
💡 공식 발표문에서 deprecated 시점(2025.08.26)과 sunset 시점(2026.08.26)이 다릅니다. deprecated 이후에도 일단은 쓸 수 있지만, sunset 이후엔 API 요청이 아예 실패합니다. 지금 당장 쓰는 데 문제가 없어도, 제품을 운영 중이라면 이 날짜 차이가 핵심입니다.
Assistants API가 조용히 비싸진 이유
Assistants API를 처음 쓸 때 많은 분이 “편하다”는 인상을 받습니다. Thread가 서버에서 대화를 알아서 쌓아주니까요. 그런데 이 편리함에 숨겨진 비용 구조가 있습니다.
대화가 길어질수록, 혹은 PDF 같은 파일을 업로드해두면, 매 턴마다 해당 파일 전체를 다시 토큰으로 처리합니다. 20페이지짜리 PDF를 업로드하고 질문을 5번 하면, 그 PDF는 5번 통째로 토큰 비용이 발생합니다. 이 구조 때문에 실제 운영 환경에서 비용이 기하급수적으로 올라가는 경우가 적지 않았습니다.
💡 Assistants API의 File Search 도구는 별도로 하루 GB당 $0.10이 청구됩니다. 첫 1GB는 무료이지만, 이건 벡터화된 데이터 기준이라 원본 파일 크기와 다릅니다. (출처: OpenAI help.openai.com/articles/8550641) 예측 가능한 비용 구조가 아닙니다.
Responses API는 캐시 활용 방식 자체가 다릅니다. store: true로 설정하면 대화 상태가 서버에 저장되면서도, 동일한 컨텍스트를 다음 턴에서 재계산하지 않습니다. 그래서 공식 내부 테스트에서 40~80% 비용 개선이 나온 겁니다.
Responses API로 바꾸면 진짜 달라지는 것
| Assistants API (기존) | Responses API (신규) | 변경 이유 |
|---|---|---|
| Assistants | Prompts | 버전 관리·롤백 가능 |
| Threads (메시지만 저장) | Conversations (아이템 저장) | 툴 호출·결과도 저장 가능 |
| Runs (폴링 필요) | Responses (단일 요청/응답) | 스트리밍·즉각 응답 지원 |
| Run steps | Items (범용 객체) | 메시지·툴콜·결과 모두 Items |
기존에는 Run 하나를 돌리고 나면 while run.status in ("queued", "in_progress") 루프로 계속 상태를 폴링해야 했습니다. 이 방식은 응답이 완성될 때까지 화면에 아무것도 보여주지 못하는 구조입니다. Responses API는 스트리밍을 기본 지원하기 때문에 응답이 생성되는 동안 실시간으로 텍스트를 표시할 수 있습니다.
💡 공식 마이그레이션 가이드와 실제 개발자 커뮤니티 반응을 같이 놓고 보면 이런 간극이 보입니다 — OpenAI는 “단순해졌다”고 발표했지만, 커뮤니티에서는 “Prompt를 API로 생성할 수 없어서 동적 assistant 구성이 불가능하다”는 불만이 공식 포럼에 올라왔습니다. 편리해진 부분과 제약이 생긴 부분이 동시에 존재합니다.
마이그레이션에서 막히는 3가지 지점
공식 가이드를 보면 마이그레이션이 간단해 보입니다. 그런데 실제로는 세 군데에서 멈추는 경우가 많습니다.
공식 문서에 명시된 내용입니다. “We will not provide an automated tool for migrating Threads to Conversations.” 기존 대화 이력을 옮기려면 직접 코드로 Thread 메시지를 순회하면서 Conversation items 형식으로 변환해야 합니다. (출처: platform.openai.com/docs/assistants/migration) 운영 중인 서비스의 대화 이력이 많을수록 이 작업 부담이 커집니다.
Assistant를 코드에서 동적으로 생성해 여러 고객사별 설정을 분리하던 방식이 그대로 통하지 않습니다. Responses API의 “Prompt”는 대시보드 UI에서만 만들 수 있고, API 생성 엔드포인트가 아직 없습니다. 개발자 커뮤니티에서 “feature parity라고 했는데 이게 왜 빠져있냐”는 지적이 공식 포럼에 올라와 있습니다.
기존 Chat Completions/Assistants API에서는 response_format을 사용했습니다. Responses API에서는 text.format으로 구조가 바뀌었습니다. 함수 정의도 외부 태그 방식(externally tagged)에서 내부 태그 방식(internally tagged)으로 변경됩니다. (출처: platform.openai.com/docs/guides/migrate-to-responses) 기존 스키마를 그대로 붙여넣으면 API 에러가 납니다.
⚠ ZDR(Zero Data Retention) 조직은 별도 조건이 있습니다. store: false를 강제로 적용하면서 동시에 추론 컨텍스트를 유지하려면 encrypted_content를 include 필드에 추가해야 합니다. 이 부분은 Assistants API에는 없던 신규 개념으로, 컴플라이언스 요건이 있는 기업은 반드시 공식 문서를 별도 확인해야 합니다.
Chat Completions API는 계속 쓸 수 있습니다
여기서 많은 분이 헷갈려합니다. “Assistants API 종료 = 기존 GPT API 전부 마이그레이션 필요”로 오해하는 경우가 있습니다. 공식 문서를 보면 다릅니다.
공식 문서 원문 (platform.openai.com/docs/guides/migrate-to-responses):
“While Chat Completions remains supported, Responses is recommended for all new projects.”
Chat Completions는 계속 지원됩니다.
즉, 이번 종료 대상은 openai.beta.threads, openai.beta.assistants 같은 베타 엔드포인트를 쓰는 Assistants API에 한정됩니다. 단순히 client.chat.completions.create()를 직접 호출하는 방식은 이번 종료와 무관합니다.
단, OpenAI는 신규 프로젝트에는 Responses API를 권장합니다. 새로 만드는 서비스라면 Chat Completions보다 Responses API로 시작하는 게 낫습니다. deep research, MCP, computer use 같은 신규 기능들이 Responses API 기반으로 추가되고 있기 때문입니다.
지금 당장 해야 할 2가지
8월 26일까지 시간이 있어 보이지만, 실제 마이그레이션은 준비·테스트·배포 사이클을 고려하면 2~3개월이 걸리는 경우가 많습니다. 지금 바로 시작해도 여유 있는 일정이 아닙니다.
1. openai.beta 엔드포인트 사용 여부 확인
코드베이스에서 openai.beta.threads, openai.beta.assistants, openai.beta.threads.runs 패턴을 검색하세요. 이 세 패턴 중 하나라도 있으면 마이그레이션 대상입니다. 없으면 이번 종료와 무관합니다.
2. Thread 이력 규모 파악 → 마이그레이션 공수 산정
자동 마이그레이션 도구가 없기 때문에, Thread가 얼마나 쌓여 있는지가 작업 규모를 좌우합니다. 신규 대화부터 Conversations로 전환하고, 기존 이력은 필요한 것만 선택적으로 백필하는 전략이 현실적입니다. (공식 가이드 권장 방식)
Responses API로 넘어가면서 얻는 실질적인 이득은 분명합니다. 스트리밍 기본 지원으로 UX가 개선되고, deep research·MCP·computer use 같은 신규 기능을 바로 붙일 수 있게 됩니다. 비용 측면에서도 캐시 효율이 올라갑니다. 그냥 마지못해 하는 마이그레이션이 아니라, 실제로 제품이 좋아지는 방향입니다.
Q&A
Q. 2026년 8월 26일 이후에도 Assistants API 코드가 돌아가나요?
아닙니다. sunset 이후에는 openai.beta.threads 등의 엔드포인트 요청이 에러를 반환합니다. 서비스가 중단될 수 있으므로, 8월 26일 전에 마이그레이션을 완료해야 합니다. (출처: OpenAI platform.openai.com/docs/assistants/migration)
Q. Azure OpenAI의 Assistants API도 같이 종료되나요?
Azure OpenAI는 별도 타임라인을 따릅니다. Microsoft Learn 공식 문서에 “Assistants API는 2026년 8월 26일에 deprecated”라고 나오지만, Azure 측 구체적인 sunset 날짜는 OpenAI와 다를 수 있습니다. Azure 기반이라면 Microsoft Azure AI Foundry 공식 문서를 따로 확인하는 것이 안전합니다.
Q. Chat Completions API도 나중에 사라지나요?
현시점에서 OpenAI는 Chat Completions를 계속 지원한다고 공식 문서에 명시했습니다. 신규 프로젝트에 Responses API를 권장하는 것이지, Chat Completions 종료 계획은 공식적으로 발표된 바 없습니다.
Q. Responses API에서 Prompt를 API로 생성하는 기능은 언제 생기나요?
OpenAI가 공식 일정을 별도로 밝히지 않은 부분입니다. 현재는 대시보드에서만 Prompt를 생성할 수 있습니다. 동적으로 여러 설정을 만들어야 하는 경우, 공식 포럼과 changelog를 주기적으로 확인하는 것이 현실적입니다.
Q. Responses API로 마이그레이션하면 비용이 낮아지나요?
케이스에 따라 다릅니다. OpenAI 내부 테스트에서 캐시 활용 효율이 Chat Completions 대비 40~80% 개선됐다고 공식 문서에 나와 있습니다. (출처: platform.openai.com/docs/guides/migrate-to-responses) 다만 이건 캐시 명중률이 높은 워크로드 기준이고, 매번 새로운 컨텍스트를 쓰는 경우엔 차이가 작을 수 있습니다.
마치며
Assistants API 종료를 처음 접하면 “또 마이그레이션?”이라는 피로감이 먼저 옵니다. 그 감정은 이해가 됩니다. 공식 포럼에서도 “베타로 시작해서 이제 와서 바꾸냐”는 반응이 실제로 나왔습니다.
그런데 공식 문서를 찬찬히 보면, 이번 변화는 단순한 API 이름 교체가 아닙니다. 폴링 방식의 Run 루프가 없어지고, 스트리밍이 기본값이 되고, deep research나 MCP 같은 기능을 단일 요청으로 묶어 쓸 수 있는 구조로 바뀌는 겁니다. 비용 구조도 실제로 달라집니다.
막히는 지점은 분명히 있습니다. Thread 자동 마이그레이션 도구가 없다는 것, Prompt를 API로 만들 수 없다는 것은 지금 당장 불편한 현실입니다. 그래도 8월 26일은 바뀌지 않습니다. 지금 코드베이스에서 openai.beta를 검색하는 것부터 시작하면, 나머지는 생각보다 수월하게 풀립니다.
📎 본 포스팅 참고 자료
본 포스팅은 2026년 3월 23일 기준으로 작성되었습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI API 요금 및 지원 정책은 공식 문서(platform.openai.com)에서 반드시 최신 내용을 직접 확인하시기 바랍니다.

댓글 남기기