2026.03.31 기준 / 퍼블릭 프리뷰

Foundry IQ, 무료라는 말이 전부일까요?

Microsoft가 3월에 조용히 올린 공식 문서에는 월 5천만 토큰 무료라는 문구가 있습니다. 그런데 실제로 2,000건 처리를 돌려보면 청구서가 $4.32로 나옵니다. 이 둘이 동시에 사실인 이유가 있습니다.

Azure AI Search 기반
gpt-4o/4.1/5 전용
SLA 미보장 단계

Foundry IQ가 뭔지, 한 줄로 먼저 정리하면

Foundry IQ는 AI 에이전트가 기업 내부 데이터에 접근할 때 쓰는 ‘지식 레이어’입니다. 쉽게 말하면, SharePoint·OneDrive·Azure Blob·OneLake 같은 여러 곳에 흩어진 문서를 하나의 지식 베이스로 묶어두고, 에이전트가 복잡한 질문을 던지면 알아서 여러 소스를 뒤져 답을 가져오게 해주는 파이프라인입니다. (출처: Microsoft Learn, Foundry IQ 개념 문서, 2026.03.10)

2026년 1월 Azure AI Foundry가 Microsoft Foundry로 이름을 바꾸면서, 그 안에 Foundry IQ가 정식 제품으로 자리를 잡았습니다. Microsoft의 January 2026 Product Terms에 공식 반영된 내용이고, 3월 현재는 퍼블릭 프리뷰 단계입니다. 프리뷰라는 말이 핵심인데, 이 부분은 뒤에서 짚겠습니다.

기존에 RAG(Retrieval-Augmented Generation)를 직접 구현하던 방식과 비교하면, Foundry IQ는 쿼리 분해·병렬 검색·결과 합산·권한 필터링까지 자동으로 처리해주는 ‘관리형’ 파이프라인입니다. 에이전트는 “이 질문에 대한 답을 줘”라고만 하면 되고, 어떤 소스를 어떻게 뒤질지는 Foundry IQ가 가져갑니다.

▲ 목차로 돌아가기

무료 5천만 토큰, 실제로는 몇 건이 되나

공식 가격 정책에는 이렇게 나와 있습니다. “무료 티어 검색 서비스는 월 5천만 토큰의 무료 에이전트 추론 토큰을 제공합니다.” (출처: Azure AI Search — Agentic Retrieval Overview, 2026.03 기준) 읽으면 넉넉해 보입니다. 그런데 직접 계산해 보면 숫자가 달라집니다.

💡 공식 계산식을 그대로 적용해봤습니다

공식 문서에서 제시한 예시 기준:

문서 청크 1만 개, 청크당 500토큰
서브쿼리당 상위 50개 청크 리랭킹
쿼리당 평균 3개의 서브쿼리
리랭킹 토큰: 쿼리 1건 = 50 × 3 × 500 = 75,000토큰

→ 무료 5천만 토큰 ÷ 75,000 = 약 667건 처리 가능

5천만이라는 숫자만 보면 여유로워 보이지만, 실제 인덱스 규모와 검색 복잡도에 따라 월 700건 미만에서 소진될 수 있습니다. 소규모 PoC라면 충분하고, 하루에 수십 건 이상 에이전트가 쿼리를 던지는 실운영 환경이라면 며칠 만에 유료 구간에 진입합니다.

게다가 공식 문서는 “무료 한도를 초과할 때 별도 알림이 없다”고 명시합니다. 한도를 넘는 순간 자동으로 종량제로 전환되고, Azure 청구서에 조용히 추가됩니다. 구체적으로는 초과분 100만 토큰당 일정 금액이 붙고, 쿼리 계획에 쓰인 Azure OpenAI 토큰은 별도 청구됩니다.

▲ 목차로 돌아가기

기존 RAG와 비용 구조가 이렇게 다릅니다

기존 단일 쿼리 RAG는 쿼리 1,000건 단위로 요금이 청구됩니다. 반면 Foundry IQ의 에이전트 검색은 토큰 100만 개 단위로 청구 단위가 바뀝니다. (출처: Azure AI Search 공식 가격 비교표, 2026.03 기준)

항목	기존 단일 쿼리 RAG	Foundry IQ 에이전트 검색
청구 단위	쿼리 1,000건	토큰 100만 개
무료 한도	무료 1,000건	무료 5,000만 토큰
LLM 비용	직접 부담 (선택)	쿼리 계획용 LLM 별도 청구
비용 예측 방식	쿼리 건수 추정	토큰 사용량 추정

공식 문서에서 제시한 계산 예시를 그대로 따라가면, 2,000건 처리 기준 에이전트 검색 비용은 $3.30(리랭킹) + 쿼리 계획 $1.02 = 총 $4.32입니다. 단순 계산이지만 이 금액이 의미하는 건 명확합니다. 쿼리 건수가 아니라 각 쿼리에서 발생하는 토큰 총량이 비용을 결정하기 때문에, 인덱스가 크고 질문이 복잡할수록 비용이 비선형으로 늘어납니다.

💡 공식 발표와 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다

Foundry IQ는 “무료”라고 홍보되지만, Azure AI Search + Azure OpenAI + 네트워킹 세 가지 청구 항목이 동시에 발생합니다. 무료인 부분은 에이전트 추론 토큰 하나뿐입니다. 쿼리 계획에 쓰이는 gpt-4o 토큰은 Azure OpenAI 계정으로 따로 나옵니다.

▲ 목차로 돌아가기

쿼리 계획 모델은 아무거나 못 씁니다

Foundry IQ의 에이전트 검색이 복잡한 질문을 여러 서브쿼리로 쪼갤 때, LLM이 그 계획을 수립합니다. 그런데 이 쿼리 계획 단계에서 쓸 수 있는 모델은 공식적으로 gpt-4o, gpt-4.1, gpt-5 시리즈로 한정됩니다. (출처: Azure AI Search Agentic Retrieval Overview, 2026.03 기준)

Claude나 Gemini, Phi를 쓰고 싶다면? 최종 답변 생성 단계에서는 쓸 수 있지만, 쿼리를 분해하는 핵심 단계는 Azure OpenAI 모델만 허용됩니다. 이 제한이 실제로 어떤 의미냐면, 이미 다른 모델을 기반으로 에이전트를 운영 중인 경우 Foundry IQ의 쿼리 계획 기능을 그냥 우회하거나, Azure OpenAI 배포를 별도로 추가해야 한다는 뜻입니다.

추가로, 공식 문서에는 이 기능 전체가 현재 퍼블릭 프리뷰 상태라고 명시합니다. “이 기능은 현재 퍼블릭 프리뷰입니다. 이 프리뷰는 서비스 수준 계약 없이 제공되며, 프로덕션 워크로드에는 권장되지 않습니다.” 이유는 공개되지 않았지만, 기능 변경이나 중단 가능성이 열려 있는 상태입니다.

▲ 목차로 돌아가기

IQ 삼각형 — 혼자 쓰면 절반만 됩니다

Microsoft는 Foundry IQ를 세 개짜리 세트의 하나로 만들었습니다. 공식 문서에 이렇게 나옵니다. Foundry IQ는 기업 데이터(SharePoint, Blob, OneLake 등)를 담당하고, Work IQ는 Teams·메일·문서 등 M365 협업 맥락을 담당하고, Fabric IQ는 Power BI·OneLake의 비즈니스 분석 데이터를 담당합니다. 셋을 함께 쓸 때 에이전트가 조직 전체 컨텍스트를 가질 수 있도록 설계됐습니다. (출처: Microsoft Learn, Foundry IQ 공식 개념 문서, 2026.03.10)

💡 세 가지를 같이 놓고 보니 이런 구분이 보였습니다

Foundry IQ — “이 정책 문서에 뭐라고 나와 있나?” (정적 지식)
Work IQ — “어제 팀 회의에서 뭐가 결정됐나?” (협업 맥락)
Fabric IQ — “작년 매출 데이터랑 비교하면 어떻게 돼?” (분석 데이터)

Foundry IQ만 붙이면 정책 문서는 잘 찾지만, 회의 맥락이나 수치 분석은 여전히 빠집니다.

이 구조가 실무에서 중요한 이유는 하나입니다. Foundry IQ 단독으로 에이전트를 구성했는데 “오늘 아침 슬랙에서 나눈 논의 내용 반영해줘”라는 질문이 들어오면, Foundry IQ는 그 정보를 볼 수 없습니다. Slack은 지원 소스 목록에 없고, M365 Teams 맥락은 Work IQ 영역입니다.

▲ 목차로 돌아가기

MS 생태계 밖이면 사실상 막힙니다

Foundry IQ가 기본으로 지원하는 인덱스 소스는 SharePoint, OneDrive, OneLake, Azure Blob Storage, Azure Data Lake Storage, 공개 웹입니다. 여기에 MCP(Model Context Protocol) 서버를 통해 외부 시스템을 연결하는 방법이 현재 프리뷰 중입니다. (출처: ITNEXT, Dave R. — From Classic RAG to Agentic Retrieval, 2025.12.02)

Slack, Gmail, GitHub Issues, Notion, Jira는 기본 소스가 아닙니다. 이 데이터를 Foundry IQ에 넣으려면 직접 SharePoint나 Azure Storage로 내보낸 다음 업로드해야 하는데, 이 시점에서 이미 데이터가 며칠치 뒤쳐진 상태입니다. 실시간 맥락이 중요한 고객 대응, 엔지니어링 이슈 트래킹 같은 용도라면 이 방식은 구조적으로 맞지 않습니다.

솔직히 말하면, 조직 전체가 M365와 Azure로 통합된 환경이 아니라면 Foundry IQ의 장점이 절반으로 줄어듭니다. 반대로 이미 SharePoint를 사내 문서 허브로 쓰고, 팀 협업이 Teams에서 이뤄지는 조직이라면 세팅 비용 대비 효과가 가장 큽니다.

▲ 목차로 돌아가기

지금 시작해도 되는 조건 딱 하나

정리해보면 Foundry IQ를 지금 써볼 만한 조건은 비교적 명확합니다. 아래 세 가지 중 두 가지 이상 해당되면 PoC를 시작해도 됩니다. 세 가지 다 해당되지 않는다면 MCP 서버 지원이 정식화되는 GA 이후를 기다리는 것이 낫습니다.

사내 문서가 SharePoint 또는 Azure Blob에 이미 올라가 있다
에이전트가 쓸 LLM으로 gpt-4o 또는 gpt-4.1을 이미 쓰고 있다
사용자 권한(Entra ID + ACL)이 문서 검색에 반드시 반영돼야 한다

반대로, 지금 바로 쓰면 안 되는 조건도 있습니다. 프로덕션 서비스에 붙이려 한다면, 퍼블릭 프리뷰에는 SLA가 없다는 점을 반드시 고려해야 합니다. 기능이 예고 없이 변경되거나 일시 중단될 수 있다는 문구가 공식 문서에 그대로 있습니다.

비용 측면에서 실용적인 시작 방법은 공식 문서에서도 권장하는 대로입니다. Azure AI Search 무료 티어 + Reasoning Level을 ‘Low’로 설정해서 LLM 호출을 최소화하는 것입니다. 이 조합이면 월 667건 기준 안에서 상당 부분 0원으로 테스트가 가능합니다.

▲ 목차로 돌아가기

Q&A 5가지

Q1. Foundry IQ는 지금 정식 서비스인가요, 프리뷰인가요?

2026년 3월 31일 기준 퍼블릭 프리뷰 단계입니다. Microsoft Learn 공식 문서에 “SLA 없이 제공되며 프로덕션 워크로드에 권장되지 않음”이라고 명시돼 있습니다. GA(정식 출시) 시기는 공식 발표가 없는 상태입니다.

Q2. Azure OpenAI 없이 Foundry IQ를 쓸 수 있나요?

쿼리 계획 기능을 끄면 LLM 없이 키워드·벡터 하이브리드 검색만 사용할 수 있습니다. 다만 이 경우 복잡한 질문 분해 기능은 동작하지 않고, 사실상 기존 Azure AI Search와 유사한 결과만 얻게 됩니다. 에이전트 검색의 핵심 기능을 쓰려면 gpt-4o 또는 gpt-4.1 배포가 필요합니다.

Q3. Slack이나 Notion 데이터를 바로 연결할 수 있나요?

직접 연결은 안 됩니다. MCP 서버를 통한 원격 연결이 현재 프리뷰 중이지만, 2026년 3월 기준으로 정식 지원 여부와 범위는 공개되지 않았습니다. Slack과 Gmail은 기본 지원 소스 목록에 없고, 수동으로 Azure Storage에 내보내야 합니다.

Q4. 무료 한도가 소진되면 어떻게 알 수 있나요?

공식 문서에서 “전환 시 별도 알림이 없다”고 명시합니다. Azure Cost Management에서 예산 알림을 미리 설정해두는 것이 유일한 실용적인 방법입니다. 무료 구간이 소진되면 자동으로 종량제 전환됩니다.

Q5. 기존 Azure AI Search 인덱스를 그대로 쓸 수 있나요?

쓸 수 있습니다. 단, 에이전트 검색(Agentic Retrieval)을 사용하려면 시맨틱 랭커(Semantic Ranker)가 활성화돼 있어야 합니다. 시맨틱 랭커를 비활성화하면 에이전트 검색도 자동으로 꺼집니다. 또한 지식 소스로 연결할 인덱스에는 기본 시맨틱 구성과 스코어링 프로필이 설정돼 있어야 합니다.

▲ 목차로 돌아가기

마치며

Foundry IQ는 기술적으로 잘 설계된 제품입니다. 에이전트 검색의 구조, 권한 레이어, Purview 통합까지 엔터프라이즈 수준으로 단단합니다. 그런데 지금 시점에서 중요한 건 “좋은가”보다 “내 환경에서 맞는가”입니다.

MS 생태계가 이미 갖춰진 조직이라면 진지하게 써볼 만합니다. 반대로 Slack과 Notion이 업무 중심인 환경에서는 지금 당장 Foundry IQ를 붙여도 커버되는 데이터가 생각보다 적습니다. 그리고 어떤 경우든 무료 5천만 토큰이 얼마나 빨리 소진되는지는 인덱스 규모를 먼저 확인하고 계산해보는 게 맞습니다.

프리뷰가 GA로 넘어가는 시점, MCP 서버 정식 지원 여부, 쿼리 계획 모델 다양화 여부가 Foundry IQ의 범용성을 결정할 세 가지 변수입니다. 이 세 개 중 하나라도 달라지면 평가가 달라질 수 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Foundry IQ는 현재 퍼블릭 프리뷰 단계로, 가격·지원 모델·기능 범위가 GA 시점에 달라질 수 있습니다. 정확한 최신 정보는 Microsoft 공식 문서를 직접 확인하세요.

Foundry IQ, 무료라는 말이 전부일까요?

Foundry IQ가 뭔지, 한 줄로 먼저 정리하면

무료 5천만 토큰, 실제로는 몇 건이 되나

기존 RAG와 비용 구조가 이렇게 다릅니다

쿼리 계획 모델은 아무거나 못 씁니다

IQ 삼각형 — 혼자 쓰면 절반만 됩니다

MS 생태계 밖이면 사실상 막힙니다

지금 시작해도 되는 조건 딱 하나

Q&A 5가지

마치며

본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

Foundry IQ, 무료라는 말이 전부일까요?

Foundry IQ, 무료라는 말이 전부일까요?

Foundry IQ가 뭔지, 한 줄로 먼저 정리하면

무료 5천만 토큰, 실제로는 몇 건이 되나

기존 RAG와 비용 구조가 이렇게 다릅니다

쿼리 계획 모델은 아무거나 못 씁니다

IQ 삼각형 — 혼자 쓰면 절반만 됩니다

MS 생태계 밖이면 사실상 막힙니다

지금 시작해도 되는 조건 딱 하나

Q&A 5가지

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기