Foundry IQ, 무료라는 말이 전부일까요?
Microsoft가 3월에 조용히 올린 공식 문서에는 월 5천만 토큰 무료라는 문구가 있습니다. 그런데 실제로 2,000건 처리를 돌려보면 청구서가 $4.32로 나옵니다. 이 둘이 동시에 사실인 이유가 있습니다.
gpt-4o/4.1/5 전용
SLA 미보장 단계
Foundry IQ가 뭔지, 한 줄로 먼저 정리하면
Foundry IQ는 AI 에이전트가 기업 내부 데이터에 접근할 때 쓰는 ‘지식 레이어’입니다. 쉽게 말하면, SharePoint·OneDrive·Azure Blob·OneLake 같은 여러 곳에 흩어진 문서를 하나의 지식 베이스로 묶어두고, 에이전트가 복잡한 질문을 던지면 알아서 여러 소스를 뒤져 답을 가져오게 해주는 파이프라인입니다. (출처: Microsoft Learn, Foundry IQ 개념 문서, 2026.03.10)
2026년 1월 Azure AI Foundry가 Microsoft Foundry로 이름을 바꾸면서, 그 안에 Foundry IQ가 정식 제품으로 자리를 잡았습니다. Microsoft의 January 2026 Product Terms에 공식 반영된 내용이고, 3월 현재는 퍼블릭 프리뷰 단계입니다. 프리뷰라는 말이 핵심인데, 이 부분은 뒤에서 짚겠습니다.
기존에 RAG(Retrieval-Augmented Generation)를 직접 구현하던 방식과 비교하면, Foundry IQ는 쿼리 분해·병렬 검색·결과 합산·권한 필터링까지 자동으로 처리해주는 ‘관리형’ 파이프라인입니다. 에이전트는 “이 질문에 대한 답을 줘”라고만 하면 되고, 어떤 소스를 어떻게 뒤질지는 Foundry IQ가 가져갑니다.
무료 5천만 토큰, 실제로는 몇 건이 되나
공식 가격 정책에는 이렇게 나와 있습니다. “무료 티어 검색 서비스는 월 5천만 토큰의 무료 에이전트 추론 토큰을 제공합니다.” (출처: Azure AI Search — Agentic Retrieval Overview, 2026.03 기준) 읽으면 넉넉해 보입니다. 그런데 직접 계산해 보면 숫자가 달라집니다.
💡 공식 계산식을 그대로 적용해봤습니다
공식 문서에서 제시한 예시 기준:
- 문서 청크 1만 개, 청크당 500토큰
- 서브쿼리당 상위 50개 청크 리랭킹
- 쿼리당 평균 3개의 서브쿼리
- 리랭킹 토큰: 쿼리 1건 = 50 × 3 × 500 = 75,000토큰
→ 무료 5천만 토큰 ÷ 75,000 = 약 667건 처리 가능
5천만이라는 숫자만 보면 여유로워 보이지만, 실제 인덱스 규모와 검색 복잡도에 따라 월 700건 미만에서 소진될 수 있습니다. 소규모 PoC라면 충분하고, 하루에 수십 건 이상 에이전트가 쿼리를 던지는 실운영 환경이라면 며칠 만에 유료 구간에 진입합니다.
게다가 공식 문서는 “무료 한도를 초과할 때 별도 알림이 없다”고 명시합니다. 한도를 넘는 순간 자동으로 종량제로 전환되고, Azure 청구서에 조용히 추가됩니다. 구체적으로는 초과분 100만 토큰당 일정 금액이 붙고, 쿼리 계획에 쓰인 Azure OpenAI 토큰은 별도 청구됩니다.
기존 RAG와 비용 구조가 이렇게 다릅니다
기존 단일 쿼리 RAG는 쿼리 1,000건 단위로 요금이 청구됩니다. 반면 Foundry IQ의 에이전트 검색은 토큰 100만 개 단위로 청구 단위가 바뀝니다. (출처: Azure AI Search 공식 가격 비교표, 2026.03 기준)
| 항목 | 기존 단일 쿼리 RAG | Foundry IQ 에이전트 검색 |
|---|---|---|
| 청구 단위 | 쿼리 1,000건 | 토큰 100만 개 |
| 무료 한도 | 무료 1,000건 | 무료 5,000만 토큰 |
| LLM 비용 | 직접 부담 (선택) | 쿼리 계획용 LLM 별도 청구 |
| 비용 예측 방식 | 쿼리 건수 추정 | 토큰 사용량 추정 |
공식 문서에서 제시한 계산 예시를 그대로 따라가면, 2,000건 처리 기준 에이전트 검색 비용은 $3.30(리랭킹) + 쿼리 계획 $1.02 = 총 $4.32입니다. 단순 계산이지만 이 금액이 의미하는 건 명확합니다. 쿼리 건수가 아니라 각 쿼리에서 발생하는 토큰 총량이 비용을 결정하기 때문에, 인덱스가 크고 질문이 복잡할수록 비용이 비선형으로 늘어납니다.
💡 공식 발표와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
Foundry IQ는 “무료”라고 홍보되지만, Azure AI Search + Azure OpenAI + 네트워킹 세 가지 청구 항목이 동시에 발생합니다. 무료인 부분은 에이전트 추론 토큰 하나뿐입니다. 쿼리 계획에 쓰이는 gpt-4o 토큰은 Azure OpenAI 계정으로 따로 나옵니다.
쿼리 계획 모델은 아무거나 못 씁니다
Foundry IQ의 에이전트 검색이 복잡한 질문을 여러 서브쿼리로 쪼갤 때, LLM이 그 계획을 수립합니다. 그런데 이 쿼리 계획 단계에서 쓸 수 있는 모델은 공식적으로 gpt-4o, gpt-4.1, gpt-5 시리즈로 한정됩니다. (출처: Azure AI Search Agentic Retrieval Overview, 2026.03 기준)
Claude나 Gemini, Phi를 쓰고 싶다면? 최종 답변 생성 단계에서는 쓸 수 있지만, 쿼리를 분해하는 핵심 단계는 Azure OpenAI 모델만 허용됩니다. 이 제한이 실제로 어떤 의미냐면, 이미 다른 모델을 기반으로 에이전트를 운영 중인 경우 Foundry IQ의 쿼리 계획 기능을 그냥 우회하거나, Azure OpenAI 배포를 별도로 추가해야 한다는 뜻입니다.
추가로, 공식 문서에는 이 기능 전체가 현재 퍼블릭 프리뷰 상태라고 명시합니다. “이 기능은 현재 퍼블릭 프리뷰입니다. 이 프리뷰는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다.” 이유는 공개되지 않았지만, 기능 변경이나 중단 가능성이 열려 있는 상태입니다.
IQ 삼각형 — 혼자 쓰면 절반만 됩니다
Microsoft는 Foundry IQ를 세 개짜리 세트의 하나로 만들었습니다. 공식 문서에 이렇게 나옵니다. Foundry IQ는 기업 데이터(SharePoint, Blob, OneLake 등)를 담당하고, Work IQ는 Teams·메일·문서 등 M365 협업 맥락을 담당하고, Fabric IQ는 Power BI·OneLake의 비즈니스 분석 데이터를 담당합니다. 셋을 함께 쓸 때 에이전트가 조직 전체 컨텍스트를 가질 수 있도록 설계됐습니다. (출처: Microsoft Learn, Foundry IQ 공식 개념 문서, 2026.03.10)
💡 세 가지를 같이 놓고 보니 이런 구분이 보였습니다
- Foundry IQ — “이 정책 문서에 뭐라고 나와 있나?” (정적 지식)
- Work IQ — “어제 팀 회의에서 뭐가 결정됐나?” (협업 맥락)
- Fabric IQ — “작년 매출 데이터랑 비교하면 어떻게 돼?” (분석 데이터)
Foundry IQ만 붙이면 정책 문서는 잘 찾지만, 회의 맥락이나 수치 분석은 여전히 빠집니다.
이 구조가 실무에서 중요한 이유는 하나입니다. Foundry IQ 단독으로 에이전트를 구성했는데 “오늘 아침 슬랙에서 나눈 논의 내용 반영해줘”라는 질문이 들어오면, Foundry IQ는 그 정보를 볼 수 없습니다. Slack은 지원 소스 목록에 없고, M365 Teams 맥락은 Work IQ 영역입니다.
MS 생태계 밖이면 사실상 막힙니다
Foundry IQ가 기본으로 지원하는 인덱스 소스는 SharePoint, OneDrive, OneLake, Azure Blob Storage, Azure Data Lake Storage, 공개 웹입니다. 여기에 MCP(Model Context Protocol) 서버를 통해 외부 시스템을 연결하는 방법이 현재 프리뷰 중입니다. (출처: ITNEXT, Dave R. — From Classic RAG to Agentic Retrieval, 2025.12.02)
Slack, Gmail, GitHub Issues, Notion, Jira는 기본 소스가 아닙니다. 이 데이터를 Foundry IQ에 넣으려면 직접 SharePoint나 Azure Storage로 내보낸 다음 업로드해야 하는데, 이 시점에서 이미 데이터가 며칠치 뒤쳐진 상태입니다. 실시간 맥락이 중요한 고객 대응, 엔지니어링 이슈 트래킹 같은 용도라면 이 방식은 구조적으로 맞지 않습니다.
솔직히 말하면, 조직 전체가 M365와 Azure로 통합된 환경이 아니라면 Foundry IQ의 장점이 절반으로 줄어듭니다. 반대로 이미 SharePoint를 사내 문서 허브로 쓰고, 팀 협업이 Teams에서 이뤄지는 조직이라면 세팅 비용 대비 효과가 가장 큽니다.
지금 시작해도 되는 조건 딱 하나
정리해보면 Foundry IQ를 지금 써볼 만한 조건은 비교적 명확합니다. 아래 세 가지 중 두 가지 이상 해당되면 PoC를 시작해도 됩니다. 세 가지 다 해당되지 않는다면 MCP 서버 지원이 정식화되는 GA 이후를 기다리는 것이 낫습니다.
- 사내 문서가 SharePoint 또는 Azure Blob에 이미 올라가 있다
- 에이전트가 쓸 LLM으로 gpt-4o 또는 gpt-4.1을 이미 쓰고 있다
- 사용자 권한(Entra ID + ACL)이 문서 검색에 반드시 반영돼야 한다
반대로, 지금 바로 쓰면 안 되는 조건도 있습니다. 프로덕션 서비스에 붙이려 한다면, 퍼블릭 프리뷰에는 SLA가 없다는 점을 반드시 고려해야 합니다. 기능이 예고 없이 변경되거나 일시 중단될 수 있다는 문구가 공식 문서에 그대로 있습니다.
비용 측면에서 실용적인 시작 방법은 공식 문서에서도 권장하는 대로입니다. Azure AI Search 무료 티어 + Reasoning Level을 ‘Low’로 설정해서 LLM 호출을 최소화하는 것입니다. 이 조합이면 월 667건 기준 안에서 상당 부분 0원으로 테스트가 가능합니다.
Q&A 5가지
마치며
Foundry IQ는 기술적으로 잘 설계된 제품입니다. 에이전트 검색의 구조, 권한 레이어, Purview 통합까지 엔터프라이즈 수준으로 단단합니다. 그런데 지금 시점에서 중요한 건 “좋은가”보다 “내 환경에서 맞는가”입니다.
MS 생태계가 이미 갖춰진 조직이라면 진지하게 써볼 만합니다. 반대로 Slack과 Notion이 업무 중심인 환경에서는 지금 당장 Foundry IQ를 붙여도 커버되는 데이터가 생각보다 적습니다. 그리고 어떤 경우든 무료 5천만 토큰이 얼마나 빨리 소진되는지는 인덱스 규모를 먼저 확인하고 계산해보는 게 맞습니다.
프리뷰가 GA로 넘어가는 시점, MCP 서버 정식 지원 여부, 쿼리 계획 모델 다양화 여부가 Foundry IQ의 범용성을 결정할 세 가지 변수입니다. 이 세 개 중 하나라도 달라지면 평가가 달라질 수 있습니다.
본 포스팅 참고 자료
- Microsoft Learn — Foundry IQ란? (2026.03.10)
- Azure AI Search — Agentic Retrieval Overview, 가격 및 구조 (2026.03 기준)
- Microsoft Azure — Foundry IQ 공식 제품 페이지 (2026.03.31 기준)
- ITNEXT — From Classic RAG to Agentic Retrieval: Inside Foundry IQ Architecture (Dave R., 2025.12.02)
- Graphlit — Microsoft Foundry IQ vs Graphlit 비교 분석 (2025.11)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Foundry IQ는 현재 퍼블릭 프리뷰 단계로, 가격·지원 모델·기능 범위가 GA 시점에 달라질 수 있습니다. 정확한 최신 정보는 Microsoft 공식 문서를 직접 확인하세요.











댓글 남기기