코인베이스 CEO 브라이언 암스트롱은 X를 통해 전날 발생한 서비스 중단 사태에 대해 “용납할 수 없다”며 향후 시스템 장애 시간을 대폭 줄이기 위해 아키텍처상 장단점을 재평가하겠다고 밝혔다.
암스트롱 CEO는 이번 장애의 근본 원인으로 AWS 데이터센터 내 여러 냉각 장치가 동시에 고장 나면서 한 데이터센터가 과열된 점을 들었다. 그는 코인베이스 시스템 대부분은 단일 가용 영역 장애에 대비해 이중화돼 정상 작동했지만, 중앙화 거래소 특성상 저지연 거래와 고객 코로케이션을 유지하면서 가용 영역 장애까지 완전히 흡수하기는 어려웠다고 설명했다.
그는 가용 영역 전환이 필요한 상황에서 서비스 중단 시간을 줄일 수 있도록 구조를 재검토하겠다며, AWS와 코인베이스 팀이 밤새 복구 작업을 진행했다고 밝혔다. 코인베이스는 추후 보다 자세한 기술 설명을 공개할 예정이다.
