구글(GOOGL)이 오픈소스 AI 개발 환경 구축을 한층 수월하게 만들기 위한 신규 도구들을 공개했다. 11일(현지시간) 미국 애틀랜타에서 열린 ‘큐브콘+클라우드네이티브콘(KubeCon + CloudNativeCon)’ 행사에서 소개된 도구들은 인공지능 환경을 운영하는 과정의 복잡성을 줄이고 속도를 개선하는 데 초점을 맞췄다. 이번 발표에는 GKE 관리형 쿠버네티스 서비스의 새로운 기능인 'GKE 포드 스냅샷'도 포함됐다.
구글이 선보인 첫 번째 오픈소스 도구는 ‘에이전트 샌드박스(Agent Sandbox)’다. 이는 AI 에이전트들이 사용하는 브라우저, 데이터베이스 등 외부 애플리케이션의 보안 위험을 줄이기 위한 격리 환경을 보다 쉽게 구축할 수 있도록 지원한다. AI 모델이 코드 편집기를 통해 악성코드를 생성하는 위협도 존재하기에, 이러한 격리 환경은 사이버 보안의 핵심으로 여겨진다.
에이전트 샌드박스는 구글이 2018년에 발표한 컨테이너 보안 오픈소스 프로젝트 ‘gVisor’를 기반으로 하며, 운영체제의 민감한 구성 요소로부터 컨테이너를 격리한다는 점에서 AI가 생성한 악성코드의 침투를 차단하는 역할을 한다. 구글 클라우드는 자사의 GKE에서 이 도구를 공식 지원하며, 개발자들이 클라우드 기반 쿠버네티스 클러스터에서 자동화된 인프라 관리와 함께 사용할 수 있도록 했다.
또한, 구글 측은 사전에 준비된 ‘프리 웜(pre-warmed)’ 샌드박스를 통해 AI의 작업 수행 속도를 높일 수 있다고 밝혔다. 이는 AI가 작업을 시작하기 전에 필요한 도구들이 탑재된 컨테이너를 미리 활성화해, 초기화 시간 없이 바로 실행할 수 있도록 하는 방식이다.
같은 날 발표된 두 번째 주요 기능인 ‘GKE 포드 스냅샷(Pod Snapshots)’은 대규모 언어 모델(LLM)의 실행 속도를 획기적으로 개선하는 데 초점을 맞췄다. 일반적으로 LLM은 실행 직전 많은 구성요소를 시스템에 이식하고 설정하는 초기화 과정을 거치며, 이로 인해 10분 이상의 대기 시간이 발생하기도 한다. 포드 스냅샷은 이러한 초기화 과정을 스냅샷 기반 복원 기술로 대체함으로써, 컨테이너 전체를 메모리에서 즉시 불러올 수 있게 만들며, 일부 사례에선 시작 시간을 80% 이상 단축시켰다고 구글은 설명했다.
구글 클라우드의 브랜든 로열(Brandon Royal) 프로덕트 매니저는 자체 블로그를 통해 “GKE 포드 스냅샷은 CPU 및 GPU 기반 AI 워크로드 모두에 적용 가능하며, 실행 대기 시간을 ‘수 분’에서 ‘수 초’로 줄일 수 있다”고 언급했다. 그는 또한 이 기능이 유휴 상태의 샌드박스를 스냅샷 형태로 저장했다가 필요 시 복원할 수 있기 때문에, 컴퓨팅 리소스를 절감하면서도 사용자 경험에 영향을 주지 않는다고 강조했다.
이와 함께 구글은 AI 훈련 과정의 효율성을 극대화할 수 있는 ‘다단계 체크포인팅(Multi-Tier Checkpointing, MTC)’ 도구 역시 오픈소스로 공개했다. AI 모델 훈련 중 오류가 발생했을 때 모든 과정을 초기화하지 않고 저장된 체크포인트로 되돌리는 기술은 이미 널리 활용되고 있지만, 구글의 MTC는 이 과정을 더욱 빠르고 간편하게 만들어준다. 이를 통해 기업들은 AI 모델을 더 빠르게 재교육하거나 업데이트할 수 있게 되며, 모델 개발 주기를 더욱 단축시킬 수 있다고 구글은 강조했다.
이번 구글의 발표는 AI 개발 및 배포 환경에서 중요한 시간과 보안의 문제를 해결하고자 하는 시도로 풀이된다. 특히 에이전트 중심의 AI 아키텍처 확산과 대형 AI 모델의 상용화를 둘러싼 경쟁이 치열해지는 상황에서, 개발자와 기업들은 보다 효율적이고 안전한 선택지를 확보하게 됐다.




