구글 클라우드가 인공지능(AI) 에이전트 개발과 운영 기능을 한데 묶은 ‘제미나이 엔터프라이즈 에이전트 플랫폼’을 공개했다. 기존 버텍스 AI(Vertex AI)를 사실상 새 허브로 재편한 것으로, 기업이 AI 에이전트를 만들고 배포하고 통제하는 전 과정을 하나의 플랫폼에서 처리하겠다는 구상이다.
이 발표는 미국 라스베이거스에서 열린 ‘구글 클라우드 넥스트 2026’에서 나왔다. 새 플랫폼은 모델 선택, 개발, 에이전트 구축 기능은 물론 통합, 오케스트레이션, 데브옵스, 보안 기능까지 묶었다. 구글 클라우드는 이를 통해 기술팀이 AI 에이전트를 개발한 뒤, 새로 공개한 ‘제미나이 엔터프라이즈’ 애플리케이션으로 임직원에게 자연스럽게 제공할 수 있다고 설명했다. 목표는 조직 전체의 업무 자동화다.
마이클 거스텐하버(Michael Gerstenhaber) 구글 클라우드 제품관리 부사장은 블로그를 통해 “초기 생성형 AI 시대의 대규모 엔지니어링을 지원하기 위해 버텍스 AI가 설계됐다면, 이제는 여러 시스템을 넘나들며 작동하는 에이전트의 복잡성을 관리해야 하는 단계”라고 밝혔다. 그는 특히 보안과 거버넌스 장치 없이 에이전트가 확산될 경우 기업이 신뢰를 확보하기 어렵다고 강조했다.
일반 직원용 ‘에이전트 스튜디오’와 개발자용 ADK 강화
구글은 AI 에이전트 구축 기능을 ‘에이전트 스튜디오’와 ‘에이전트 개발 키트(ADK)’를 중심으로 강화했다. 에이전트 스튜디오는 비개발자도 활용할 수 있는 로우코드 시각 인터페이스를 제공해, 드래그앤드롭 방식으로 에이전트 로직을 설계할 수 있게 했다.
반면 전문 개발자를 위한 ADK는 더 복잡한 작업에 초점이 맞춰졌다. 구글은 강력한 추론 성능을 지원하는 모델 접근 권한과 함께, 여러 하위 에이전트를 연결해 복합 문제를 처리하는 그래프 기반 프레임워크를 새로 도입했다. 이를 통해 단일 에이전트가 아니라 ‘다중 에이전트 팀’을 구성하는 방식이 가능해졌다는 설명이다.
또 내부 데이터 연동도 쉬워졌다. 구글은 ADK가 별도 맞춤형 파이프라인 없이 기업 내부 데이터와 연결될 수 있도록 생태계 통합 기능을 기본 지원한다고 밝혔다. 빅쿼리(BigQuery), 펍/섭(Pub/Sub) 같은 데이터 플랫폼과 연계해 대규모 비동기 작업, 예를 들어 콘텐츠 평가나 데이터 분석 같은 백그라운드 업무를 에이전트가 처리할 수 있도록 했다.
실서비스 운영 겨냥한 ‘런타임’·‘메모리’ 기능 추가
구글 클라우드는 개념검증 수준을 넘어 실제 업무 환경에서 AI 에이전트를 운영할 수 있도록 ‘에이전트 런타임’도 개편했다. 새 런타임은 에이전트 배포를 단순화하고, 며칠씩 지속되는 장기 워크플로를 지원한다. 에이전트끼리 서로 작업을 위임하는 오케스트레이션 기능도 포함돼, 복잡한 업무를 여러 전문 에이전트가 나눠 수행할 수 있다.
대규모 운영에서 핵심이 되는 ‘문맥 유지’ 기능도 보강됐다. 구글은 대화 내용을 바탕으로 장기 기억을 동적으로 생성·관리하는 ‘에이전트 메모리 뱅크’를 새로 만들었다. 여기에 ‘메모리 프로필’을 더해, 에이전트가 필요한 세부 정보를 낮은 지연 시간으로 다시 불러올 수 있도록 했다. 기업 입장에선 문맥 손실을 줄이고, 반복 업무의 정확도를 높이는 장치로 볼 수 있다.
보안·거버넌스 전면 배치…에이전트마다 고유 신원 부여
이번 플랫폼에서 구글이 특히 힘을 준 부분은 보안과 통제다. 구글은 ‘보안 내재형’ 구조를 적용해, 고객이 직접 만든 에이전트든 파트너 생태계에서 들여온 에이전트든 동일한 기업 정책 통제를 적용할 수 있도록 했다고 밝혔다.
핵심은 ‘에이전트 아이덴티티’다. 사람마다 신원이 있듯 각 AI 에이전트에도 고유 암호화 ID를 부여해, 어떤 행동을 했는지 감사 가능한 기록을 남기도록 설계했다. 이 기록은 사전에 정의된 권한 정책과 연결할 수 있어, 기업 내부 규정 준수와 책임 추적에 도움이 될 것으로 보인다.
이와 함께 승인된 도구와 에이전트를 중앙에서 관리하는 ‘에이전트 레지스트리’, 전체 에이전트 운용 현황을 감독하는 ‘에이전트 게이트웨이’도 추가됐다. 구글은 이를 통해 관리자들이 전체 AI 에이전트 운영 체계를 한눈에 보고 일관된 보안 정책을 적용할 수 있다고 설명했다. 프롬프트 공격 방어와 실시간 행위 모니터링 기능은 ‘에이전트 시큐리티’ 대시보드에서 제공된다.
배포 전 테스트부터 운영 최적화까지 지원
구글 클라우드는 AI 에이전트의 성능을 사전에 검증하고, 운영 중에도 지속적으로 개선하는 기능도 제공한다. ‘에이전트 시뮬레이션’은 가상 도구와 합성 워크로드를 활용해 통제된 환경에서 에이전트를 시험할 수 있게 한다. 실제 투입 이후에는 ‘에이전트 평가’ 도구로 업무 수행 결과를 계속 점수화할 수 있다.
문제가 생겼을 때 원인을 깊게 살펴보는 기능도 포함됐다. ‘에이전트 옵저버빌리티’는 에이전트의 복잡한 추론 경로를 시각적으로 추적할 수 있도록 지원하며, 장애나 오류를 디버깅하는 데 초점을 맞췄다. 기대한 성능이 나오지 않을 경우에는 ‘에이전트 옵티마이저’가 시스템 지시문을 자동 조정해 정확도를 높이는 방식으로 개선을 돕는다.
구글 모델 중심이지만 외부 모델도 200종 이상 지원
구글이 자체 제미나이 모델 사용을 적극 유도할 가능성은 크지만, 공개된 내용만 보면 개방형 생태계 전략도 유지하고 있다. 회사는 사용자가 200개 이상의 모델에 ‘우선급’으로 접근할 수 있다고 밝혔다. 여기에는 제미나이 3.1 프로, 제미나이 3.1 플래시, 오픈소스 모델 젬마 4, 음악·오디오 생성용 리리아 3가 포함된다.
외부 모델도 지원한다. 구글은 앤스로픽(Anthropic PBC)의 클로드 3.5 소네트와 하이쿠 등 서드파티 모델도 함께 제공한다고 밝혔다. 기업 고객 입장에서는 특정 모델에 고정되기보다, 업무 목적에 따라 모델을 선택할 수 있는 유연성을 확보한 셈이다.
구글 클라우드의 이번 발표는 단순한 AI 기능 추가가 아니라, 기업용 AI 에이전트 운영 체계를 플랫폼 단위로 재정비한 움직임에 가깝다. 특히 ‘자율형 기업’이라는 목표 아래 개발, 배포, 보안, 최적화를 하나로 묶으려는 시도라는 점에서 의미가 크다. 다만 실제 기업 현장에서 이런 AI 에이전트가 얼마나 안정적으로 작동하고, 보안 우려를 얼마나 줄일 수 있을지가 향후 경쟁력의 핵심 변수가 될 전망이다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

