폴리곤(MATIC)의 핵심 인프라에서 발생한 기술적 장애로 인해 네트워크 블록 생산이 약 한 시간 동안 중단되는 사태가 발생했다. 이번 사고는 폴리곤 생태계 내 RPC(원격 프로시저 호출) 제공업체들과의 조율 실패에서 비롯된 것으로 확인됐다. 해당 문제는 다양한 디앱과 사용자 서비스에 지연 및 오류를 유발했지만, 핵심 체인 작동에는 직접적인 영향을 주지는 않았다.
사건은 7월 30일 오전 6시 52분(UTC 기준)부터 시작됐다. 폴리곤의 공동 창업자인 산디프 나일월(Sandeep Nailwal)은 개인 SNS를 통해 "일부 RPC 제공업체가 체인 상단의 업그레이드 적용 과정에서 일시적으로 장애를 겪었다"고 설명했다. 그는 "해당 장애는 블록체인 네트워크 전반의 문제라기보다 RPC 기반 앱에서 나타난 제한적인 이슈였다"고 진단했다. 이와 관련해 퀵노드(QuickNode) 등 일부 인프라 제공사들은 블록 높이 74,592,238에서 블록 생산이 멈췄다고 보고했고, 이를 폴리곤스캔(Poylgonscan) 데이터가 뒷받침했다.
문제의 핵심은 합의 계층인 ‘하임달(Heimdall)’의 최신 버전(0.2.16) 업데이트 과정에 있었다. 나일월은 "해당 핫픽스 적용 과정에서 일시적으로 하임달 합의 모듈이 정지됐고, 이로 인해 일부 노드가 동기화에서 이탈하면서 사용자 입장에서 체인 정지로 오인될 수 있는 상황이 연출됐다"고 전했다. 반면, 집행 계층인 보르(Bor)는 정상 작동을 이어갔으며, 이로 인해 영향받지 않은 RPC 제공업체에서는 블록 생산이 지속됐다.
폴리곤 측은 사건 발생 직후 비상 대응팀을 가동, 문제를 추적해 신속한 패치를 배포했다. 사건 보고는 09시 52분에 시작됐고, 불과 9분 만에 원인 규명이 이뤄졌으며, 11시 01분에 모든 장애가 공식 종료됐다. 나일월은 "이번 일로 피해를 본 사용자와 개발자들에게 사과드리며, 앞으로는 합의 계층과 인프라 운영 간의 명확한 커뮤니케이션 체계를 구축해 유사 상황의 재발을 막겠다"고 강조했다.
이번 폴리곤 네트워크 사건은 단순한 기술 결함이 아닌, 고도화된 블록체인 인프라가 직면한 ‘운영상 정합성’ 문제를 상기시킨다. 특히 폴리곤처럼 글로벌 디앱과 사용자의 의존도가 높은 네트워크에서는, 단 한 번의 업그레이드 실패만으로도 신뢰와 기능성에 타격을 줄 수 있다는 점에서 시사하는 바가 크다.