azure-ai-projects 2.0.0b4
IT/AI
Foundry Agent Service, GA라도 이 조건은 다릅니다
2026년 3월 16일, Microsoft가 GTC 2026 무대에서 Foundry Agent Service의 정식 출시(GA)를 선언했습니다.
OpenAI Responses API와 와이어 호환된다는 발표에 “기존 코드 그대로 쓸 수 있겠다”는 기대감이 생기는 건 자연스럽습니다.
막상 공식 문서와 한계 보고서를 같이 놓고 보니 GA 뱃지 뒤에 숨어 있는 조건들이 보였습니다.
OpenAI 코드 그대로 쓸 수 있다는 말이 맞는 이유
Foundry Agent Service GA 발표에서 Microsoft가 가장 강조한 부분은 하나입니다.
“OpenAI Responses API 위에 그대로 올라가 있다”는 것입니다.
공식 GA 발표문에 이렇게 나옵니다.
“If you’re building with the Responses API today, migrating to Foundry is minimal code changes.”
(출처: Microsoft Foundry Dev Blog, 2026.03.16)
즉, OpenAI Agents SDK나 Responses API로 만든 에이전트 코드를 Foundry로 옮길 때
대규모 재작성 없이 엔터프라이즈 보안, 프라이빗 네트워킹, 추적(Tracing)을 바로 얹을 수 있습니다.
같은 와이어 프로토콜을 쓰기 때문에 DeepSeek, xAI Grok, Meta LLaMA 같은 서드파티 모델을
기존 OpenAI 오케스트레이션 코드에 그냥 꽂아 쓸 수도 있습니다.
💡 공식 발표문과 마이그레이션 가이드를 같이 놓고 보니 이런 차이가 보였습니다.
“최소한의 코드 변경”이라는 말이 맞지만, 기존 azure-ai-agents 패키지를 쓰고 있었다면
azure-ai-projects로의 패키지 교체부터 시작해야 합니다.
단순히 엔드포인트 URL만 바꾸는 게 아닙니다.
그런데 GA 선언에는 없는 게 있습니다
GA 발표문을 읽다 보면 “이미 다 됩니다”처럼 읽히는 부분이 있습니다.
그런데 같은 날 공개된 공식 한도·제한 문서를 확인하면 그림이 달라집니다.
Connected Agents는 GA가 아니라 여전히 퍼블릭 프리뷰 상태입니다.
멀티 에이전트 오케스트레이션을 프로덕션에 쓰려면 GA와 프리뷰 경계를 직접 구분해야 합니다.
(출처: Microsoft Learn 공식 문서 — Quotas and Limits for Foundry Agent Service, 2026.03.11)
Hosted Agents(컨테이너 에이전트)도 프리뷰입니다.
6개 신규 리전(East US, North Central US, Sweden Central, Southeast Asia, Japan East 등)에 확대됐다고 발표했지만,
SLA 보장 없는 프리뷰 기능이라는 점을 공식 문서에 명시하고 있습니다.
Groundedness 필터도 프리뷰, 파일 검색 기능은 Italy North와 Brazil South에서 아예 동작하지 않습니다.
💡 GA와 프리뷰가 섞인 구조입니다.
“Foundry Agent Service GA 됐다”는 말이 맞지만,
쓰려는 기능이 그 GA 범위 안에 있는지는 직접 확인해야 합니다.
SDK 패키지 교체도 필요합니다
2026년 2월에 배포된 Python SDK 2.0.0b4부터는 도구 클래스 이름이 전부 바뀌었습니다.
기존에 쓰던 AzureAISearchAgentTool은 AzureAISearchTool로,
MicrosoftFabricAgentTool은 MicrosoftFabricPreviewTool로 바뀌었습니다.
(출처: Microsoft Foundry Dev Blog, What’s New February 2026, 2026.03.06)
에이전트 생성 API도 달라졌습니다.
기존 agents.create()는 삭제됐고, agents.create_version()만 남았습니다.
“최소한의 코드 변경”이라는 공식 표현이 맞지만,
패키지 버전과 API 표면이 동시에 바뀌었기 때문에 실제로는 체계적인 마이그레이션 작업이 필요합니다.
Voice Live, 3개 서비스를 1개로 줄인다는 것의 의미
이번 GA 발표에서 가장 눈에 띄는 기능 중 하나가 Voice Live와 Foundry Agent Service의 통합입니다.
지금까지 음성 에이전트를 만들려면 STT(음성→텍스트), LLM 추론, TTS(텍스트→음성)를 별도로
연결해야 했습니다. 레이턴시 지점도 3곳, 요금 청구 포인트도 3곳이었습니다.
Voice Live는 이 파이프라인을 단일 관리형 API로 통합합니다.
공식 발표문에 나온 핵심을 그대로 옮기면,
에이전트의 프롬프트·도구 정의·안전 설정은 Foundry에서 관리하고,
Voice Live가 오디오 입출력만 담당하는 구조입니다.
음성 상호작용도 텍스트와 같은 추적(Tracing)과 평가(Evaluation) 파이프라인을 탑니다.
(출처: Microsoft Foundry Dev Blog, Foundry Agent Service GA, 2026.03.16)
💡 음성 기능을 추가해도 모니터링 구조가 텍스트와 분리되지 않는다는 점이 핵심입니다.
Gulf Air가 이미 파일럿 중인 Falcon Eye 플랫폼이 이 구조로 운영되고 있습니다.
“음성만 2등급 취급받는 관측 구조”에서 벗어난 것입니다.
단, 아직 퍼블릭 프리뷰입니다
Voice Live와 Foundry Agent Service 통합은 프리뷰 상태입니다.
AgentSessionConfig를 이용해 에이전트에 연결하는 코드는 이미 공개됐지만,
SLA 없이 운영해야 합니다.
현재 지원 리전도 GA 서비스 전체 리전과 다를 수 있어, 배포 전 리전별 Tool 지원 매트릭스를
공식 문서에서 직접 확인해야 합니다.
MCP 인증 4종, 어떤 상황에 무엇을 써야 하나
GA와 함께 MCP 인증 방식이 4가지로 정리됐습니다.
단순히 옵션이 늘어난 것처럼 보이지만, 실제로는 각각 쓰임이 다릅니다.
어떤 걸 선택하느냐에 따라 보안 구조와 권한 격리 방식이 완전히 달라집니다.
| 인증 방식 | 쓸 때 | 주의사항 |
|---|---|---|
| Key-based | 조직 내부 공용 도구 | 키 유출 시 전체 공유 |
| Entra Agent Identity | 서비스-서비스 간 연결 | 에이전트 자신으로 인증 |
| Managed Identity | 프로젝트별 권한 격리 | 자격증명 관리 불필요 |
| OAuth Passthrough | 사용자 개인 데이터 접근 | OneDrive·SaaS API 등 |
(출처: Microsoft Foundry Dev Blog, Foundry Agent Service GA — MCP authentication section, 2026.03.16)
가장 신경 써야 할 건 OAuth Identity Passthrough입니다.
에이전트가 시스템 공용 계정이 아니라 특정 사용자의 권한으로 OneDrive나 Salesforce에
접근해야 하는 경우에 쓰는 방식입니다.
사용자가 표준 OAuth 흐름으로 MCP 서버에 직접 인증하면 에이전트가 그 자격증명을 위임받아 동작합니다.
💡 4종이 공존한다는 건 “하나 고르면 된다”가 아닙니다.
한 에이전트 안에서도 내부 도구는 Managed Identity, 사용자 데이터 접근은 OAuth Passthrough를
동시에 쓰는 구성이 실제 프로덕션에서 더 현실적입니다.
공식 한도 수치, 직접 계산해봤습니다
Foundry Agent Service GA와 함께 공개된 공식 한도 문서를 보면 숫자 몇 가지가 눈에 들어옵니다.
숫자만 보면 넉넉해 보이지만, 실제 사용 패턴을 대입하면 생각이 달라집니다.
(출처: Microsoft Learn — Quotas and Limits for Foundry Agent Service, 2026.03.11)
📌 에이전트당 최대 도구 수: 128개
128개라는 숫자는 크게 느껴지지만, MCP 서버 하나에 수십 개의 툴이 붙어 있는 구조에서는
생각보다 빠르게 채워집니다.
도구는 사용하지 않더라도 에이전트에 등록된 것만으로 토큰을 소비합니다.
공식 문서에도 “Register only the tools you need”를 명시적으로 권고하고 있습니다.
→ 도구 128개가 모두 등록돼 있을 때 단순 “안녕하세요” 메시지 한 줄에도
2,300~2,700 토큰이 소비된다는 커뮤니티 측정치가 있습니다.
(출처: Microsoft Q&A — “Excessive Token Usage for Simple Response”, 2026.01 보고)
예상 토큰의 50배 이상입니다.
📌 중첩 도구 호출 한도: 최대 5단계
에이전트가 도구를 호출하고, 그 도구가 또 다른 에이전트·도구를 호출하는 구조는
실제 복잡한 워크플로에서 흔합니다.
5단계를 초과하면 assistant_tool_depth_exceeded 오류가 발생합니다.
→ 이 한도는 고정값이며 포털이나 API를 통한 증가가 공식적으로 불가능합니다.
Microsoft 공식 답변에 그대로 나옵니다.
(출처: Microsoft Q&A — “Request for Azure AI Foundry Agent Tool Depth Increase”, 2026.01)
5단계를 초과하는 워크플로는 에이전트 내부 집계 구조를 바꿔서 깊이를 줄이는 방식으로 재설계해야 합니다.
📌 스레드당 최대 메시지 수: 100,000개
10만 개는 넉넉해 보입니다. 그런데 고객 지원 에이전트가 하루 수백~수천 건의 세션을 처리할 때,
같은 스레드를 재사용하는 설계라면 누적 속도가 빠릅니다.
공식 문서는 “스레드를 세션 상태로 보고 대화가 길어지면 새 스레드로 교체”하라고 명시합니다.
스레드 한도 초과 시 message_limit_exceeded 오류가 반환됩니다.
실제 사용 환경에서 드러난 한계들
GA 선언과 동시에 기술 한계 보고서도 있습니다.
주목할 만한 부분만 골라보면 세 가지입니다.
① 지식 소스를 무시하는 에이전트 문제
에이전트에 지식 소스를 연결했는데도 아예 검색을 수행하지 않고 환각(Hallucination) 응답을 생성하는 사례가
다수 보고됐습니다. “Always retrieve”를 켜도 동일 증상이 나타납니다.
Microsoft 공식 답변은 직접적입니다.
“Agents consistently call tools, while the built-in grounding connector is NOT ENFORCED in this preview release.”
(출처: Microsoft Q&A — “Azure AI Foundry Agent Ignores Knowledge Sources”, 2026.01)
Groundedness 필터는 프리뷰이기 때문입니다.
⚠️ GA 출시 에이전트인데 지식 소스 강제 연결은 아직 프리뷰입니다.
RAG가 핵심인 서비스라면 지식 소스 커넥터 대신 Azure AI Search 도구를 직접 연결하는 방식을 써야 합니다.
② MCP 리전별 동작 차이
MCP 도구가 West Europe에서 실패했는데 Sweden Central로 옮기자 즉시 동작한 사례가 보고됐습니다.
MCP 기능이 모든 리전에서 균일하게 지원되지 않는다는 신호입니다.
(출처: Microsoft Q&A — MCP tool region issue report, 2026.01)
Foundry 공식 문서도 “Not all tools are available in every region”이라고 명시합니다.
③ 숨겨진 토큰 소비
Foundry가 내부적으로 주입하는 시스템 프롬프트, 도구 메타데이터, 대화 히스토리 때문에
사용자가 직접 보내지 않은 토큰이 상당량 소비됩니다.
간단한 메시지 한 줄에 2,700 토큰이 나오는 상황에서
비용 예측을 순수 입력 토큰 기준으로만 계산하면 실제 청구서와 큰 차이가 납니다.
자주 묻는 질문 5가지
Q1. 기존 OpenAI Agents SDK로 만든 에이전트를 Foundry로 옮기면 정말 코드 수정이 거의 없나요?
+
와이어 프로토콜(Responses API)이 호환되기 때문에 에이전트 로직 자체는 거의 그대로입니다.
단, azure-ai-agents 패키지를 쓰고 있었다면 azure-ai-projects로 교체가 필요하고,
도구 클래스 이름 변경(Agent→Tool 인픽스 제거)도 반영해야 합니다.
“최소한의 코드 변경”은 맞지만 패키지 의존성 교체는 포함됩니다.
Q2. 한국 리전(Korea Central, Korea South)에서 Foundry Agent Service 쓸 수 있나요?
+
Foundry Agent Service는 Azure OpenAI Responses API와 같은 리전에서 제공됩니다.
현재 공식 문서에서 지원 리전을 직접 확인해야 합니다.
Hosted Agents 프리뷰 기준 신규 추가 리전에 한국이 포함되지 않았기 때문에,
가용 여부를 Foundry 포털 모델 경험 화면에서 먼저 확인하는 게 가장 정확합니다.
(출처: Microsoft Learn — Quotas and Limits for Foundry Agent Service, 2026.03.11)
Q3. DeepSeek나 Grok 같은 서드파티 모델을 Foundry Agent Service에서 쓸 수 있나요?
+
네, 가능합니다. Foundry Agent Service GA는 DeepSeek-V3-0324, DeepSeek-R1-0528, Grok 4.0(GA),
Meta LLaMA-4-Maverick 등을 포함한 다중 모델 카탈로그를 지원합니다.
에이전트 단위로 다른 모델을 선택하거나,
계획(Planning)에는 DeepSeek, 생성(Generation)에는 GPT-5 계열을 조합하는 것도 가능합니다.
(출처: Microsoft Learn — Quotas and Limits, Other model collections 섹션, 2026.03.11)
Q4. Voice Live를 지금 바로 프로덕션에 써도 될까요?
+
Voice Live + Foundry Agent Service 통합은 현재 퍼블릭 프리뷰입니다.
SLA 보장이 없고 기능 변경 가능성이 있습니다.
고객 대면 서비스에 바로 배포하기보다는,
파일럿·내부 운영 도구 수준에서 먼저 검증한 뒤 GA 전환 시점을 확인하는 것이 현실적입니다.
Q5. LangGraph로 만든 멀티 에이전트 워크플로를 Foundry에서 그대로 쓸 수 있나요?
+
직접 통합을 지원합니다. Foundry Agent Service GA는 LangGraph와의 직접 연동을 공식 지원하며,
복잡한 멀티 에이전트 그래프를 구성하면서 개별 에이전트는 Foundry 내부에서 관리되고
Control Plane을 통해 추적됩니다.
단, Connected Agents 기능 자체는 아직 프리뷰이기 때문에 에이전트 간 포인트-투-포인트 호출 구조는
프리뷰 조건이 적용됩니다.
(출처: Redmondmag, Microsoft Brings Production Ready AI Agents at GTC, 2026.03.17)
마치며 — GA라는 뱃지의 실제 범위
Foundry Agent Service GA는 실제로 중요한 마일스톤입니다.
OpenAI 호환 런타임, 프라이빗 네트워킹 end-to-end, MCP 4종 인증, Evaluation GA까지
엔터프라이즈 프로덕션에 필요한 핵심 인프라가 정식 출시된 것은 사실입니다.
그런데 개인적으로 이번 발표에서 가장 중요하게 보는 건 따로 있습니다.
Microsoft가 한계를 공식 문서에 명시했다는 점입니다.
중첩 도구 5단계 한도, 지역별 기능 차이, 지식 소스 강제 적용 미지원, 숨겨진 토큰 소비까지
공식 Q&A와 한도 문서에 그대로 나와 있습니다.
이게 Foundry를 쓸지 말지보다 먼저 봐야 할 정보입니다.
연결하려는 기능이 GA 범위에 있는지, 아니면 프리뷰인지를 먼저 확인하는 게 시작입니다.
ai.azure.com 포털에서 직접 리전·모델·도구 조합을 확인하는 것이 발표문보다 훨씬 정확합니다.
📚 본 포스팅 참고 자료
-
Microsoft Foundry Dev Blog — Foundry Agent Service is GA: private networking, Voice Live, and enterprise-grade evaluations
https://devblogs.microsoft.com/foundry/foundry-agent-service-ga/
(2026.03.16) -
Microsoft Foundry Dev Blog — What’s New in Microsoft Foundry | February 2026
https://devblogs.microsoft.com/foundry/whats-new-in-microsoft-foundry-feb-2026/
(2026.03.06) -
Microsoft Learn — Quotas and Limits for Microsoft Foundry Agent Service
https://learn.microsoft.com/en-us/azure/foundry/agents/concepts/limits-quotas-regions
(2026.03.11) -
Redmondmag — Microsoft Brings Production Ready AI Agents at GTC
https://redmondmag.com/articles/2026/03/17/microsoft-brings-production-ready-ai-agents-at-gtc.aspx
(2026.03.17) -
Medium — Azure AI Foundry Agent Service: Technical Limitations (Comprehensive Analysis)
https://medium.com/@juliansmiles_40140/azure-ai-foundry-agent-service-technical-limitations-6b0f00ff4adc
(2026.01.28)
본 포스팅은 2026년 3월 23일 기준으로 작성됐습니다.
Microsoft Foundry Agent Service의 기능, 리전 가용성, 요금, GA/프리뷰 상태는 Microsoft의 업데이트에 따라
언제든지 변경될 수 있습니다.
최신 정보는 Microsoft Foundry 공식 포털과
Foundry 개발자 블로그에서 직접 확인하시기 바랍니다.

댓글 남기기