OpenAI 공식 문서 기준
D-157 카운트다운
OpenAI Assistants API 폐지,
D-157 지금 안 바꾸면 멈춥니다
2026년 8월 26일, OpenAI Assistants API가 완전히 종료됩니다. 한국어 설명이 거의 없는 사이, 실제 마이그레이션 과정에서 비용이 최대 50% 오른다는 함정과 공식 문서가 명시한 제약 조건을 공식 수치와 함께 정리했습니다.
Assistants API, 왜 지금 없애는 걸까요
결론부터 말씀드리면, Assistants API는 “추론 모델이 등장하기 전 에이전트를 구현하기 위한 초기 시도”였습니다. OpenAI가 공식 폐지 공지(2025년 8월 26일)에서 직접 이렇게 표현했습니다. (출처: OpenAI 커뮤니티 공식 공지, 2025.08.26)
GPT-5 같은 강력한 추론 모델이 나오면서, Threads와 Runs를 서버에서 관리해주는 복잡한 구조 대신 훨씬 단순하게 입력 → 출력 아이템으로 처리하는 Responses API가 주력 방향이 됐습니다. Responses API는 이미 Chat Completions보다 토큰 활동량에서 앞섰다고 공지에서 밝혔습니다. 그게 폐지의 신호였습니다.
중요한 타임라인을 짚으면 이렇습니다. 2024년 12월 18일에 Assistants API v1 베타 접속이 종료됐고, 2025년 8월 26일에 정식 폐지가 공지됐으며, 2026년 8월 26일에 API 자체가 완전히 꺼집니다. 지금(2026년 3월 22일)부터 D-157입니다.
💡 공식 발표와 실제 종료 날짜 사이를 놓고 보면 이런 그림이 나왔습니다
폐지 선언 → 마이그레이션 가이드 공개 → 1년 뒤 셧다운. 1년이라는 시간을 줬지만, 한국 개발자 커뮤니티에서는 관련 한국어 글이 거의 없었습니다. 지금이 첫 정리 타이밍입니다.
무엇이 무엇으로 바뀌나요 — 개념 대응표
Assistants API를 쓰던 분이라면 Assistant, Thread, Run, Run step이라는 4가지 개념에 익숙하실 겁니다. Responses API로 넘어가면 이것들이 각각 다른 이름의 개념으로 대체됩니다. (출처: OpenAI 공식 마이그레이션 가이드, platform.openai.com/docs/assistants/migration)
| 기존 (Assistants API) | 신규 (Responses 플랫폼) | 핵심 차이 |
|---|---|---|
| Assistant | Prompt | 모델·도구·지시문 묶음. Dashboard에서만 생성 가능 (API 불가) |
| Thread | Conversation | 메시지만 저장 → 메시지·툴콜·툴출력 등 Items 저장, 30일 TTL 없음 |
| Run | Response | 비동기 폴링 → 입력 아이템 전송 후 출력 아이템 수신으로 단순화 |
| Run step | Item | 메시지·툴콜·출력 등 모든 유형을 하나의 Item 타입으로 통합 |
바꿔 말하면, Run을 실행하고 상태를 while 루프로 폴링하던 코드가 사라집니다. 대신 openai.responses.create()를 한 번 호출하면 끝입니다. 구조가 단순해진 건 맞지만, 그 단순함이 비용에 미치는 영향이 따로 있습니다.
마이그레이션하면 비용이 싸진다고요? 직접 계산해봤습니다
OpenAI 공식 마이그레이션 가이드는 Responses API가 “캐시 활용도를 40~80% 개선해 비용을 낮춘다”고 설명합니다. (출처: platform.openai.com/docs/guides/migrate-to-responses) 맞습니다. 그런데 RAG(파일 검색)를 쓰는 서비스라면 이야기가 달라집니다.
⚠️ file_search 툴 호출 요금 — Responses API에만 추가 부과
Responses API에서 file_search 툴을 사용하면 1,000회 호출당 $2.50가 추가로 청구됩니다. Assistants API에서는 이 요금이 없었습니다. (출처: OpenAI 공식 가격 정책, platform.openai.com/pricing)
수치로 직접 따라 계산해보면 이렇습니다:
기존 Assistants API 비용 (질문 1,000건 기준):
→ 입력 토큰: 30k × 1,000 × $0.15/1M = $4.50
→ file_search 추가 요금: $0
→ 합계: 약 $4.50 ~ $5.00
Responses API 동일 시나리오:
→ 입력 토큰: 동일 = $4.50
→ file_search 툴 호출: 1,000회 × $2.50/1k = $2.50 추가
→ 합계: 약 $7.00 → 실질 비용 약 50% 증가
RAG를 매 질문마다 호출하는 구조라면 마이그레이션 이후 청구서가 달라집니다. 실제로 이를 먼저 경험한 개발자는 커뮤니티에서 “슬쩍 가격을 올린 방식”이라고 지적했습니다. (출처: OpenAI Developer Community, 2025.03.23)
단, 캐시 개선 효과가 실제로 40~80%라면 토큰 비용은 그만큼 줄어듭니다. 캐시 히트율이 높은 서비스라면 상쇄될 수 있지만, 그 전제가 성립하는지 먼저 확인해야 합니다.
Prompts는 API로 못 만든다는 사실, 알고 계셨나요
Assistants API에서는 `openai.beta.assistants.create()`로 코드 안에서 Assistant 객체를 동적으로 생성할 수 있었습니다. 고객별로 다른 지시문을 가진 어시스턴트를 수백 개 만드는 서비스들이 이 방식을 써왔습니다.
Responses API의 대응 개념인 Prompt는 다릅니다. OpenAI 공식 마이그레이션 문서에 딱 이렇게 나옵니다. “Prompts can only be created in the dashboard.” (출처: platform.openai.com/docs/assistants/migration) API로 생성하는 방법이 없습니다.
💡 공식 문서와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
마이그레이션 가이드는 “기능 동등성(feature parity)에 도달했다”고 선언하지만, 동적 Assistant 생성은 여전히 지원하지 않습니다. OpenAI 개발자 커뮤니티에서 이를 두고 “기능 동등이 아니다”는 반론이 나온 것도 이 때문입니다. 동적으로 Assistant를 생성하는 구조였다면 아키텍처 자체를 다시 설계해야 합니다.
대신 취할 수 있는 방법은 세 가지입니다. 첫째, 중요한 Assistant들을 Dashboard에서 Prompt로 수동 전환한 뒤 Prompt ID를 소스 코드에 저장하는 방식입니다. 둘째, 지시문을 코드에서 직접 `instructions` 파라미터로 넘기는 stateless 방식으로 설계를 바꾸는 겁니다. 셋째, 2026년 8월 26일 이전에 이행이 어렵다면 wire-compatible 대안(기존 Assistants API 엔드포인트를 흉내 내는 서드파티 구현)을 임시 브릿지로 활용하는 방법도 있습니다.
Chat Completions 쓰는 분들, 이건 해당 없습니다
이 부분이 한국어 블로그에서 가장 많이 잘못 전달될 것 같아서 먼저 짚습니다. 이번 폐지는 Assistants API(`/v1/assistants`, `/v1/threads`)만 해당됩니다. Chat Completions API(`/v1/chat/completions`)는 폐지 예정이 없습니다.
OpenAI 공식 마이그레이션 가이드에 이 내용이 명시돼 있습니다. “Chat Completions remains supported. Responses is recommended for all new projects.” (출처: platform.openai.com/docs/guides/migrate-to-responses) Chat Completions는 계속 동작하며, Responses API로 마이그레이션은 의무가 아닌 권장 사항입니다.
💡 영향을 받는 서비스와 안 받는 서비스를 정리하면 이렇습니다
영향 있음: openai.beta.assistants, openai.beta.threads, openai.beta.threads.runs 를 사용 중인 코드
영향 없음: openai.chat.completions.create() 만 사용 중인 코드
막상 해보면 다릅니다. 처음 공지를 봤을 때 “API 전체가 바뀌는 줄 알았다”는 반응이 많았는데, 실제 영향 범위는 생각보다 좁습니다. 확인 방법은 코드베이스에서 `openai.beta`를 검색하는 것입니다. 이 접두사가 있는 호출이 하나도 없다면 당장 할 일이 없습니다.
단계별 전환 로드맵 — 3월부터 8월까지
ragwalla.com의 마이그레이션 가이드(2026.01.28 업데이트)와 OpenAI 공식 문서를 교차해 현실적인 일정으로 정리했습니다. D-157 기준으로 남은 시간을 역산하면 이렇습니다.
지금 ~ 3월 말: 영향 범위 파악
코드베이스에서 openai.beta 를 검색해 Assistants, Threads, Runs 호출이 몇 개인지 파악합니다. 벡터 스토어와 파일 업로드 의존도, 멀티턴 대화 유지 방식도 확인합니다.
4월 ~ 5월: 프로토타입 구현
가장 중요한 Assistant 1개를 Responses API로 전환합니다. Thread 히스토리를 Conversations API로 백필하는 코드를 먼저 작성하고, file_search 비용 모니터링도 함께 구축합니다. 전환 시간은 구조 변경이 없다면 약 2시간, 있다면 더 길어집니다.
6월 ~ 7월: 단계적 프로덕션 전환
기능 플래그로 사용자 트래픽 일부를 Responses API로 라우팅합니다. 응답 품질과 비용을 Assistants API와 병렬 비교합니다. 동적 Assistant 생성을 사용 중이라면 이 단계에서 아키텍처 전환 작업을 병행해야 합니다.
8월 26일 이전: 전환 완료 필수
이 날짜 이후 Assistants API 엔드포인트는 호출 자체가 불가능해집니다. 기존 Thread 히스토리도 접근할 수 없게 되므로 중요한 대화 데이터는 미리 내보내야 합니다. 8월 1일을 실질적인 내부 데드라인으로 잡는 것을 권장합니다.
빠른 이행이 어렵다면 wire-compatible 구현을 임시 브릿지로 활용하는 방법도 있습니다. 기존 openai.beta.* 코드를 그대로 두고 base URL만 바꾸는 방식으로, 리팩토링 시간이 부족할 때 선택지가 됩니다. 단, OpenAI 네이티브 Responses API의 최신 기능(deep research, MCP, computer use)은 이 경로에서 사용 불가합니다.
Q&A
Q1. Chat Completions를 쓰고 있는데, 이번 폐지에 영향이 있나요?
없습니다. Chat Completions API는 계속 지원됩니다. 이번 폐지는 openai.beta.assistants, openai.beta.threads 를 사용하는 코드에만 해당합니다. 코드에서 openai.beta를 검색해 결과가 없다면 당장 할 일이 없습니다.
Q2. Conversations API를 쓰면 대화 기록이 영구 보존되나요?
Conversations에 저장된 아이템은 30일 TTL이 없습니다. 단, Response 객체 자체는 기본 30일 보관 후 삭제됩니다. store: false로 설정하면 저장 자체를 비활성화할 수도 있습니다. 컴플라이언스 요건이 있는 서비스라면 이 부분을 먼저 확인해야 합니다. (출처: OpenAI 공식 문서, developers.openai.com/api/docs/guides/your-data)
Q3. 기존 Thread 히스토리를 백필하는 공식 도구가 있나요?
없습니다. OpenAI는 공식 마이그레이션 가이드에서 “Thread를 Conversation으로 자동 마이그레이션하는 도구는 제공하지 않는다”고 명시했습니다. 새 사용자 대화는 Conversation으로 바로 전환하고, 기존 Thread 히스토리는 직접 코드로 백필해야 합니다. 공식 가이드에 파이썬 예시 코드가 포함돼 있습니다. (출처: platform.openai.com/docs/assistants/migration)
Q4. file_search 비용 절감 방법이 있나요?
매 질문마다 file_search 툴을 호출하는 대신, 관련성이 낮은 질문에서는 호출 자체를 건너뛰는 로직을 애플리케이션 레벨에서 구현하는 방법이 있습니다. 또한 max_num_results 파라미터를 조절해 검색 범위를 제한하는 것도 효과가 있습니다. 정확한 비용은 OpenAI 공식 가격 페이지에서 최신 수치를 확인해야 합니다. (출처: platform.openai.com/pricing)
Q5. Azure OpenAI에서 Assistants API를 쓰고 있어도 같은 날짜에 폐지되나요?
Microsoft Azure OpenAI의 경우 2026년 8월 26일 폐지 일정이 동일하게 적용된다는 답변이 Microsoft 공식 문서에 나와 있습니다. 다만 Azure는 자체 마이그레이션 일정과 지원 정책을 별도로 가질 수 있으므로, Azure OpenAI 문서와 Microsoft 공식 지원 채널을 별도로 확인하는 것이 안전합니다. (출처: learn.microsoft.com, 2025.10)
마치며
솔직히 말하면, 이 주제를 한국어로 제대로 정리한 글이 거의 없었습니다. D-157 카운트다운이 진행 중인데도요.
핵심을 한 줄로 요약하면, Assistants API를 쓰고 있다면 8월 26일 전에 Responses API로 전환해야 하고, 그 과정에서 RAG 비용 증가와 Prompts API 미지원이라는 두 가지 함정이 기다리고 있습니다. Chat Completions만 쓰는 분들은 이번 건 해당 없습니다.
좋은 소식은, 단순한 챗 애플리케이션이라면 실제 전환 작업 자체는 2시간 내외로 끝난다는 실제 사례가 있다는 점입니다. 복잡한 동적 Assistant 생성 구조라면 이야기가 달라지지만, 그런 서비스일수록 지금 바로 시작하는 게 낫습니다.
이 부분이 좀 아쉬웠습니다 — 공식 가이드는 마이그레이션의 장점 위주로 작성돼 있어, file_search 비용 증가나 Prompts API 미지원 같은 내용을 파악하려면 커뮤니티 글을 직접 뒤져야 했습니다. 앞으로 변경이 있으면 아래 참고 자료를 통해 직접 확인해보세요.
본 포스팅 참고 자료
본 포스팅은 2026년 3월 22일 기준 OpenAI 공식 문서를 바탕으로 작성했습니다. 본 포스팅 작성 이후 OpenAI의 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 중요한 마이그레이션 결정 전에는 반드시 OpenAI 공식 문서(platform.openai.com)에서 최신 내용을 직접 확인하시기 바랍니다.

댓글 남기기