구글 클라우드(Google Cloud)에서 발생한 계정 및 접근관리 시스템(IAM)의 설정 오류로 인해 전 세계 인터넷 서비스에 광범위한 장애가 발생했다. 이번 사태는 현지시간으로 6월 11일 오전 미국 서부 표준시 기준 늦은 시간에 시작됐으며, 주요 클라우드 컴포넌트의 중단을 유발하면서 구글 워크스페이스, 서드파티 앱, 클라우드플레어(Cloudflare)까지 여파가 확산됐다.
문제는 구글 클라우드의 IAM 시스템에서 잘못된 구성으로 인해 시작됐다. 이 오류는 앱 엔진(App Engine), 파이어스토어(Firestore), 클라우드 SQL, 빅쿼리(BigQuery), 메모리스토어(Memorystore) 등 다양한 핵심 서비스에 영향을 미쳤고, 이들 서비스에 의존하는 플랫폼들은 일시적으로 접속 불가 또는 간헐적인 접근 장애를 겪었다.
클라우드플레어는 가장 먼저 문제를 보고한 기업 중 하나였다. 해당 기업은 워커스 KV, 인증 서비스, 워커스 AI, 스트림, 대시보드의 일부 기능 등에서 장애가 발생했으며, 이는 자사의 일부 서비스가 구글 클라우드를 기반으로 하고 있기 때문이라고 설명했다. 클라우드플레어 측은 “이번 서비스 중단은 구글 클라우드의 장애로 인한 것”이라며 시스템 의존성을 강조했다.
이날 장애는 구글 워크스페이스 사용자들에게도 직격탄이었다. 지메일(Gmail), 드라이브(Drive), 문서(Docs), 캘린더(Calendar), 미트(Meet), 채팅(Chat) 등의 업무용 앱이 기능하지 않았고, 구글 홈 및 네스트(Nest) 기기의 연결에도 문제가 발생했다. 음성 검색, 구글 어시스턴트의 반응 지연 현상도 다수 보고됐다. AI 기반 서비스인 제미니(Gemini)와 렌즈(Lens), 디스커버(Discover) 역시 일부 지역에서 접속 불가능했다.
이번 장애는 구글 클라우드 기반 서비스를 사용하는 수많은 글로벌 기업들에게도 영향을 미쳤다. 스포티파이(Spotify), 디스코드(Discord), 스냅(Snap), 쇼피파이(Shopify), 리플릿(Replit), 앤쓰로픽(Anthropic), 캐릭터.AI(Character Technologies), 푸보TV(fuboTV), UPS 등은 서비스 지연 또는 사용성 저하를 겪었다.
구글은 11시 46분(현지 시간 기준)부터 클라우드 상태 페이지를 통해 상황을 지속적으로 업데이트했다. 현재 대부분의 서비스는 정상화됐지만, 일부 제품은 여전히 잔여 장애가 지속되고 있다고 설명했다. 장애보고 플랫폼 다운디텍터(Downdetector)에 따르면, 오후 2시 30분경 보고 수가 최고조에 달했으며, 일정 시간 이후까지도 문제 제보가 이어졌다.
한편, 일부에서는 아마존웹서비스(AWS) 역시 장애를 겪은 것으로 보인다는 주장이 제기됐지만, 명확한 연관성은 확인되지 않았다. 다만 아마존의 자회사인 트위치(Twitch)는 도메인 시스템(DNS), 인증, CDN 같은 네트워크 차원의 상호작용으로 인해 간접적인 영향을 받았을 가능성이 제기됐다.
이번 사태는 대형 클라우드 사업자 간 서비스 간섭과 상호의존 구조의 민낯을 드러내는 사례로, 기업들의 멀티 클라우드 전략에 대한 재검토를 촉발할 것으로 보인다. 데이터 보안과 서비스 탄력성 확보를 위한 기술적, 제도적 보완이 시급하다는 목소리도 커지고 있다.