AG-UI 프로토콜 사용법: MCP·A2A 몰라도 이것 모르면 AI 앱 반쪽

Published on

in

AG-UI 프로토콜 사용법: MCP·A2A 몰라도 이것 모르면 AI 앱 반쪽

2026 · AI 에이전트 표준 프로토콜

AG-UI 프로토콜 사용법:
MCP·A2A 알아도 이것 모르면 AI 앱 반쪽

AI 에이전트가 아무리 똑똑해도 사용자 화면과 실시간으로 대화하지 못하면 그냥 백엔드 프로그램에 불과합니다.
AG-UI 프로토콜은 MCP·A2A에 이어 에이전틱 AI 생태계의 마지막 퍼즐을 완성하는 개방형 표준으로,
2026년 현재 LangGraph·CrewAI·Google ADK·AWS Strands·Microsoft Agent Framework가 모두 공식 지원을 선언했습니다.

오픈소스 MIT
16가지 표준 이벤트
9개 이상 프레임워크 지원
CopilotKit 주도
한국어 콘텐츠 최초 심층 분석

AG-UI 프로토콜이란? 에이전트의 ‘얼굴’이 필요한 이유

AG-UI(Agent-User Interaction Protocol)는 AI 에이전트 백엔드와 사용자 인터페이스(UI) 사이의 양방향 실시간 통신을 표준화하는 경량 이벤트 기반 개방형 프로토콜입니다. 2025년 5월 CopilotKit 팀이 오픈소스(MIT 라이선스)로 공개했으며, 2026년 현재 AI 에이전트 생태계에서 가장 빠르게 채택되고 있는 신흥 표준입니다.

쉽게 말하면, 챗GPT 같은 AI가 답변을 타이핑하듯 화면에 실시간으로 보여주는 그 ‘스트리밍 경험’을 어떤 AI 에이전트든, 어떤 프론트엔드 앱에서든 동일하게 구현할 수 있게 해주는 공통 규격이라고 이해하면 됩니다. 개발자는 더 이상 프레임워크마다 다른 방식으로 UI 통신 레이어를 처음부터 만들 필요가 없어집니다.

💡 한 줄 정의: AG-UI는 AI 에이전트를 백그라운드 프로세스에서 사용자와 함께 ‘협력하는 동료’로 바꿔주는 연결 레이어입니다. 에이전트가 실행되는 동안 진행 상황을 보여주고, 사용자 승인을 받고, 상태를 함께 편집하는 모든 것이 AG-UI를 통해 이루어집니다.

AI 에이전트 붐이 일면서 LangGraph, CrewAI, AutoGen 등 수십 개의 에이전트 프레임워크가 등장했지만, 각 프레임워크는 저마다의 방식으로 프론트엔드와 통신하도록 설계되어 있었습니다. 개발자들은 새 프레임워크를 도입할 때마다 처음부터 UI 연동 코드를 다시 작성해야 했고, 이는 엄청난 반복 작업과 유지보수 비용으로 이어졌습니다. CopilotKit 팀이 LangGraph, CrewAI와 협업하는 과정에서 이 문제를 반복적으로 마주치면서 업계 전체가 공유할 수 있는 표준 프로토콜의 필요성을 절감하게 된 것이 AG-UI 탄생의 배경입니다.

▲ 목차로 돌아가기

MCP·A2A·AG-UI 삼각편대: 역할이 다른 세 프로토콜

AI 에이전트 생태계에는 현재 세 가지 핵심 프로토콜이 공존하며 각자 맡은 영역이 완전히 다릅니다. 이 셋은 경쟁 관계가 아니라 서로를 보완하는 레이어드 아키텍처를 형성합니다. 아래 표로 한눈에 비교해 보겠습니다.

세 가지 에이전트 프로토콜 역할 비교
프로토콜 주도 조직 연결 대상 비유 핵심 기능
MCP Anthropic 에이전트 ↔ 도구/데이터 AI의 “손” 외부 API, DB, 파일 시스템 연동
A2A Google 에이전트 ↔ 에이전트 AI의 “팀워크” 다중 에이전트 협업, 위임
AG-UI CopilotKit 에이전트 ↔ 사용자 UI AI의 “얼굴” 실시간 스트리밍, 상태 동기화, Human-in-the-loop

MCP가 2024년 말 Anthropic에 의해 발표되고 A2A가 2025년 초 Google이 주도하면서, 에이전트 생태계의 두 축이 자리를 잡았습니다. 그러나 두 프로토콜 모두 에이전트가 사용자와 어떻게 ‘대화’하는지, 즉 프론트엔드와의 인터랙션은 다루지 않았습니다. AG-UI는 정확히 이 공백을 채웁니다.

💡 실제 워크플로우 예시: 사용자가 “지난 분기 영업 보고서 분석해줘”라고 입력하면 → AG-UI가 요청을 에이전트에 전달 → 에이전트가 MCP로 CRM 데이터베이스 조회 → 복잡한 분석은 A2A로 전문 분석 에이전트에 위임 → 결과가 다시 AG-UI를 통해 사용자 화면에 실시간 스트리밍됩니다. 세 프로토콜이 맞물리며 비로소 완전한 에이전트 경험이 완성됩니다.

개인적으로 이 삼각편대 구조가 인상적인 이유는 각 프로토콜이 서로 다른 빅테크가 주도하면서도 상호 운용성을 명시적으로 설계했다는 점입니다. AG-UI는 공식적으로 A2A 미들웨어 통합도 지원하고 있으며, MCP Apps와의 연동도 공식 문서에서 다루고 있습니다. 에코시스템이 분열되지 않도록 처음부터 협력 구조로 설계된 것입니다.

▲ 목차로 돌아가기

AG-UI가 해결하는 4가지 기술적 난제

AG-UI가 없던 시절, 에이전트 앱 개발자들이 반복적으로 부딪혔던 고통스러운 문제들이 있었습니다. AG-UI는 이 네 가지 문제를 프로토콜 수준에서 표준적으로 해결합니다.

  • 1

    실시간 스트리밍의 불일치 문제. LLM은 토큰을 점진적으로 생성하지만, 전통적인 REST API는 응답 전체가 완성될 때까지 기다렸다가 한 번에 전송합니다. AG-UI는 TEXT_MESSAGE_CONTENT 이벤트를 통해 토큰 하나하나를 스트리밍하여 사용자가 AI가 ‘실시간으로 타이핑하는’ 경험을 얻을 수 있게 합니다.
  • 2

    도구 호출 진행 상황 가시성 부재. 에이전트가 코드를 실행하거나 API를 호출하는 동안 사용자 화면은 아무것도 보여주지 않거나 단순 로딩 스피너만 표시했습니다. AG-UI의 TOOL_CALL_START / TOOL_CALL_END 이벤트는 어떤 도구가 실행되는지 실시간으로 UI에 전달하고, 필요하면 사용자 승인(Human-in-the-loop)을 요청하는 흐름도 표준으로 지원합니다.
  • 3

    에이전트-UI 상태 불일치. 에이전트가 생성하는 계획, 표, 코드는 단계별로 변화하는데, 매번 전체 데이터를 전송하면 대역폭 낭비입니다. AG-UI의 STATE_DELTA 이벤트는 변경된 부분만 JSON Patch 형식으로 전송하여 에이전트와 앱이 언제나 같은 상태를 바라보도록 양방향 동기화를 구현합니다.
  • 4

    멀티 요청·취소 처리의 복잡성. 사용자가 여러 질문을 동시에 보내거나 진행 중인 작업을 취소할 때, 백엔드와 프론트엔드의 상태가 뒤엉키는 문제가 빈번했습니다. AG-UI는 RUN_STARTED / RUN_FINISHED 이벤트와 명확한 실행 생명주기(Lifecycle) 정의로 이 문제를 깔끔하게 처리합니다.

▲ 목차로 돌아가기

AG-UI 핵심 아키텍처: 16가지 이벤트로 움직이는 스트림

AG-UI의 작동 방식은 단순하면서도 강력합니다. 프론트엔드 앱이 에이전트 엔드포인트에 HTTP POST 요청을 보내면, 에이전트 백엔드는 Server-Sent Events(SSE) 스트림을 통해 약 16가지 표준 이벤트 유형의 JSON 메시지를 연속 전송합니다. 이 단일 이벤트 스트림이 에이전트와 사용자 UI 사이의 모든 통신을 처리합니다.

주요 이벤트 유형

TEXT_MESSAGE_CONTENT
TEXT_MESSAGE_START
TEXT_MESSAGE_END
TOOL_CALL_START
TOOL_CALL_ARGS
TOOL_CALL_END
STATE_DELTA
STATE_SNAPSHOT
RUN_STARTED
RUN_FINISHED
RUN_ERROR
STEP_STARTED
STEP_FINISHED
MESSAGES_SNAPSHOT
CUSTOM
RAW

이 이벤트들이 순서화된 스트림으로 흐르면서 프론트엔드는 에이전트의 실행 상태를 밀리초 단위로 반영할 수 있습니다. 특히 STATE_DELTA 이벤트는 JSON Patch(RFC 6902) 형식을 사용해 변경된 부분만 전송하므로 대역폭을 최소화하면서도 정확한 상태 동기화를 달성합니다.

React에서 AG-UI 연동 예시

백엔드는 어떤 언어로 작성해도 됩니다. TypeScript, Python은 물론 공식 SDK가 Kotlin, Go, Java, Rust, Dart, Ruby까지 지원합니다. 에이전트 백엔드가 AG-UI 이벤트 스트림만 발생시키면, 어떤 AG-UI 호환 프론트엔드와도 즉시 연동됩니다. 이것이 AG-UI가 강조하는 ‘에코시스템 파편화 방지’의 핵심입니다.

▲ 목차로 돌아가기

지원 생태계 완전 정리: 이미 9개 주요 프레임워크가 탑재

AG-UI의 가장 강력한 무기는 ‘출발부터 완성된 생태계’입니다. 2026년 3월 현재, 주요 에이전트 프레임워크 대부분이 AG-UI를 공식 지원하고 있습니다. 아래 표는 현재 1st Party 지원이 확정된 프레임워크 목록입니다.

AG-UI 지원 프레임워크 현황 (2026년 3월 기준)
프레임워크 운영 주체 지원 수준 비고
LangGraph LangChain 파트너십 (완전 지원) 최초 협력 파트너
CrewAI CrewAI Inc. 파트너십 (완전 지원) 최초 협력 파트너
Microsoft Agent Framework Microsoft 1st Party Azure AI 통합
Google ADK Google 1st Party Gemini 에이전트 연동
AWS Strands Agents Amazon 1st Party Bedrock 에이전트 지원 예정
Pydantic AI Pydantic 1st Party Python 생태계
LlamaIndex LlamaIndex 1st Party RAG 에이전트 연동
Mastra Mastra 1st Party TypeScript 특화
AG2 (AutoGen) Microsoft Research 1st Party 멀티에이전트 특화

여기서 주목할 점은 Microsoft, Google, Amazon이라는 빅테크 3사가 모두 AG-UI를 1st Party로 채택했다는 사실입니다. 이는 AG-UI가 단순한 스타트업의 오픈소스 실험을 넘어, 업계 전체가 인정하는 실질적 표준(De facto standard)으로 자리 잡아가고 있음을 의미합니다. 또한 OpenAI Agent SDK와 Cloudflare Agents도 현재 통합 작업이 진행 중이어서, 머지않아 모든 주요 AI 플랫폼이 AG-UI를 통해 연결될 가능성이 높습니다.

📌 SDK 지원 언어: TypeScript, Python, Kotlin, Go, Java, Rust, Dart, Ruby — 사실상 모든 주요 언어를 커버합니다. 프론트엔드 개발자든 백엔드 개발자든, 본인의 언어로 AG-UI를 구현할 수 있습니다.

▲ 목차로 돌아가기

실전 적용 시나리오: 비개발자도 이해하는 AG-UI 활용법

AG-UI는 개발자만의 기술이 아닙니다. AG-UI가 적용된 앱을 실제로 어떻게 경험하게 되는지, 비개발자도 이해할 수 있는 세 가지 시나리오로 살펴보겠습니다.

시나리오 1 — AI 업무 도우미: 공유 상태(Shared State) 활용

팀 프로젝트 관리 앱에서 AI 에이전트에게 “다음 주 스프린트 계획을 세워줘”라고 요청하면, 에이전트가 작업 목록을 생성하는 동안 칸반 보드가 실시간으로 업데이트됩니다. 에이전트가 변경할 때마다 STATE_DELTA 이벤트가 발생하고, 사용자는 완성된 계획을 기다릴 필요 없이 생성 과정을 보면서 중간에 수정 지시를 내릴 수 있습니다. 이것이 AG-UI의 양방향 공유 상태 동기화입니다.

시나리오 2 — AI 코딩 도우미: Human-in-the-Loop

Cursor IDE 같은 AI 코딩 도구에서 “이 버그 고쳐줘”라고 입력하면, 에이전트가 코드를 분석하고 수정안을 제안하다가 영향 범위가 큰 파일을 건드리기 직전 “이 파일을 수정해도 될까요?”라고 사용자에게 묻습니다. AG-UI의 Human-in-the-Loop 기능이 에이전트 실행 흐름 중간에 자연스럽게 사용자 확인을 삽입해 주는 것입니다. 무분별한 자동화의 위험을 방지하는 중요한 안전장치입니다.

시나리오 3 — 고객 서비스 챗봇: Generative UI

쇼핑몰 고객이 “내 주문 상태 알려줘”라고 묻자 챗봇이 단순 텍스트 대신 실시간 배송 추적 카드 컴포넌트를 화면에 렌더링합니다. AG-UI의 Generative UI는 에이전트가 텍스트 응답 대신 구조화된 컴포넌트를 동적으로 생성할 수 있게 해 줍니다. 사용자 입장에서는 훨씬 직관적이고 정보가 풍부한 인터랙션을 경험하게 됩니다.

🔗 AG-UI Dojo에서 직접 체험: dojo.ag-ui.com에서 LangGraph, CrewAI, Google ADK 등 각 프레임워크별 데모를 브라우저에서 즉시 실행해볼 수 있습니다. 코드는 50~200줄로 핵심 패턴만 담겨 있어 빠른 학습에 최적화되어 있습니다.

▲ 목차로 돌아가기

AG-UI를 지금 당장 주목해야 하는 3가지 이유 (주관적 통찰)

기술 스택을 선택할 때 중요한 것은 현재의 기능뿐만 아니라 ‘이 기술이 어디로 향하는가’입니다. AG-UI를 지금 공부해야 한다고 생각하는 이유 세 가지를 솔직하게 이야기합니다.

  • 1

    빅테크 3사가 동시에 선택한 표준은 사라지지 않습니다. Microsoft, Google, Amazon이 각자의 에이전트 프레임워크에 AG-UI를 1st Party로 통합했다는 것은 이 프로토콜이 최소 수년간 업계 표준으로 유지될 것임을 사실상 보증합니다. HTTP나 REST처럼, 에이전트 앱 개발의 기반 인프라가 되어가고 있습니다.
  • 2

    에이전틱 AI의 성패는 결국 UX에서 갈립니다. 아무리 뛰어난 AI 에이전트라도 사용자에게 ‘무슨 일이 벌어지고 있는지’ 보여주지 못하면 신뢰를 얻을 수 없습니다. AG-UI는 에이전트의 실행 투명성(Transparency)과 사용자 통제권(Control)을 기술적으로 구현하는 유일한 표준화된 방법입니다. 기업 도입의 가장 큰 장벽인 ‘AI 블랙박스 문제’를 해결하는 핵심 도구입니다.
  • 3

    지금이 콘텐츠 공백을 선점할 최적기입니다. 한국에서 AG-UI를 심층 분석한 한국어 콘텐츠는 2026년 3월 현재 극히 드뭅니다. MCP가 한국에서 본격적으로 알려지기 시작할 때 먼저 작성된 콘텐츠들이 지금도 상위권을 차지하고 있는 것처럼, AG-UI 역시 지금 양질의 콘텐츠를 선점하는 것이 검색 유입과 전문성 확립에 결정적인 기회가 됩니다.

AG-UI를 공부하는 가장 빠른 방법은 공식 GitHub(github.com/ag-ui-protocol/ag-ui)에서 npx create-ag-ui-app my-agent-app 명령어 한 줄로 앱을 만들고, AG-UI Dojo의 예제를 하나씩 실행해보는 것입니다. MIT 라이선스이므로 상업적 활용도 완전히 자유롭습니다.

▲ 목차로 돌아가기

🙋 자주 묻는 질문 Q&A

AG-UI는 MCP나 A2A를 대체하는 건가요?

아닙니다. AG-UI는 MCP, A2A와 경쟁하지 않습니다. 세 프로토콜은 각각 다른 레이어를 담당합니다. MCP는 에이전트가 외부 도구·데이터를 사용하는 방법을, A2A는 에이전트끼리 협업하는 방법을, AG-UI는 에이전트가 사용자 UI와 실시간 소통하는 방법을 표준화합니다. 완전한 에이전트 앱을 만들려면 세 프로토콜이 모두 필요합니다. AG-UI 공식 문서도 “AG-UI는 MCP, A2A를 보완한다”고 명시하고 있습니다.

AG-UI를 사용하려면 CopilotKit을 반드시 써야 하나요?

아닙니다. AG-UI는 개방형 표준 프로토콜이므로 CopilotKit 없이도 구현할 수 있습니다. TypeScript, Python, Go 등 다양한 언어로 AG-UI 이벤트 스트림을 직접 구현하거나, Microsoft Agent Framework, Google ADK 등 1st Party 지원 프레임워크에 내장된 AG-UI를 그대로 사용할 수 있습니다. CopilotKit은 AG-UI 위에서 React 컴포넌트, 가드레일, 애널리틱스 등 추가 기능을 제공하는 상위 레이어일 뿐입니다.

Server-Sent Events(SSE)만 지원하나요? WebSocket은요?

AG-UI는 특정 전송 방식에 종속되지 않도록 설계된 유연한 미들웨어 레이어를 포함하고 있습니다. 기본 참조 구현은 HTTP + SSE를 사용하지만, WebSocket, Webhook 등 다른 이벤트 전송 방식도 지원합니다. 프로덕션 환경의 요구사항에 맞게 전송 레이어를 선택할 수 있으며, 에이전트 이벤트 형식 자체는 동일하게 유지됩니다.

비개발자가 AG-UI의 혜택을 받는 방법이 있나요?

직접 AG-UI를 구현하지 않더라도, AG-UI가 탑재된 제품들을 통해 혜택을 받을 수 있습니다. LangGraph나 CrewAI 기반으로 만들어진 AI 업무 자동화 도구, AG-UI Dojo의 노코드 데모, CopilotKit 기반 SaaS 제품들이 모두 AG-UI의 실시간 인터랙션을 활용합니다. 사용자 입장에서는 AI가 ‘블랙박스’처럼 느껴지지 않고 진행 상황을 투명하게 보여주는 앱이라면 AG-UI가 적용된 가능성이 높습니다.

AG-UI와 A2UI(Google)는 같은 것인가요?

이름이 비슷하지만 다른 개념입니다. AG-UI는 에이전트 백엔드와 프론트엔드 앱 사이의 완전한 양방향 런타임 연결을 표준화하는 프로토콜입니다. 반면 A2UI(Agent-to-User Interface)는 Google이 발표한 생성형 UI 사양으로, AI 에이전트가 선언적 JSON으로 UI 위젯을 동적으로 생성하는 방식을 정의합니다. AG-UI의 Generative UI 기능과 A2UI는 상호 보완적으로 함께 사용할 수 있습니다.

마치며 — AG-UI가 바꿀 AI 앱의 미래

2024년 말 MCP가 등장했을 때, 많은 사람들이 “AI가 드디어 외부 세계와 연결됐다”고 흥분했습니다. 2025년 초 A2A가 나왔을 때는 “이제 에이전트들이 팀을 이뤄 일한다”는 기대감이 쏟아졌습니다. 그리고 지금, AG-UI가 에이전트와 사람 사이의 마지막 연결고리를 완성했습니다.

개인적인 생각을 덧붙이자면, AG-UI가 특별한 이유는 기술적 정교함보다 ‘철학’에 있습니다. 에이전트를 블랙박스가 아닌 투명한 협력자로 만드는 것, 자동화 속에서도 사람이 최종 결정권을 유지하는 것, 이 두 가지를 프로토콜 수준에서 설계한 것이 AG-UI의 가장 큰 가치라고 생각합니다. 앞으로 AI 에이전트가 업무의 중심이 되는 시대에, AG-UI는 단순한 기술 표준이 아니라 ‘사람과 AI가 어떻게 함께 일해야 하는가’에 대한 대답이기도 합니다.

지금 당장 개발자라면 docs.ag-ui.com에서 퀵스타트를 시작해 보세요. 비개발자라면 AG-UI Dojo(dojo.ag-ui.com)에서 브라우저로 데모를 실행해 보세요. AI 에이전트가 화면 앞에서 어떻게 살아 움직이는지 눈으로 확인하는 순간, AG-UI가 왜 중요한지 단번에 이해하게 될 것입니다.

※ 본 포스팅은 2026년 3월 9일 기준 공개된 공식 문서 및 GitHub 정보를 바탕으로 작성되었습니다.
AG-UI 프로토콜 사양 및 지원 프레임워크 목록은 업데이트될 수 있으므로
최신 정보는 공식 문서(docs.ag-ui.com)를 반드시 확인하시기 바랍니다.
본 콘텐츠는 정보 제공 목적으로 작성되었으며, 특정 제품·서비스의 구매나 투자를 권유하지 않습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기