10일 오후 3시 45분경부터 OpenAI의 ChatGPT와 Sora 서비스가 전 세계적으로 동시 장애를 일으켰다. 오후 11시 OpenAI가 공식 상태 페이지를 통해 오류 원인을 파악했다고 발표했지만, 6시간 넘게 지속된 이번 장애는 AI 서비스에 의존하는 전 세계 기업과 개인 사용자들에게 상당한 불편을 초래했다.
장애 신고는 북미, 유럽, 호주 지역에서 집중적으로 접수됐으며, 서비스 장애 추적 사이트 다운디텍터에는 이른 시각부터 사용 불가 신고가 급증했다.

기업 운영에 잠재된 치명적 리스크 드러나
이번 장애는 AI를 핵심 업무 인프라로 활용하는 기업들이 직면할 수 있는 심각한 리스크를 여실히 보여줬다. 고객 응대용 챗봇 중단으로 CS 업무가 마비되거나, AI 기반 콘텐츠 제작 작업이 전면 중단되는 등 실제 피해 사례들이 보고됐다.
전문가들은 더 우려스러운 시나리오들을 제기하고 있다. 만약 의료진단 보조 AI가 장기간 중단된다면 응급환자 진료에 치명적 지연이 발생할 수 있고, 평소 AI 판독 시스템에 의존하던 영상의학과에서는 의료진이 모든 검사 결과를 수동으로 재검토해야 하는 상황이 벌어질 수 있다.
금융업계의 우려도 크다. AI 기반 신용평가 시스템이 마비될 경우 대출 승인 업무가 전면 중단될 수 있고, AI 트레이딩 알고리즘에 의존하는 증권사들은 거래량 급감과 함께 막대한 손실을 입을 가능성이 있다.
제조업계에서는 AI 품질검사 시스템 중단 시 생산라인 전체가 멈춰설 수 있다는 분석이 나온다. 특히 반도체나 정밀부품 제조업체의 경우 AI 불량품 검출 없이는 출하가 불가능해 하루 생산량 전체를 폐기해야 하는 상황까지 발생할 수 있다.
법무 분야에서도 리스크는 상당하다. AI 계약서 검토 시스템에 장애가 발생할 경우 긴급한 M&A나 대규모 거래의 최종 계약 검토가 지연되면서 수천억 원 규모의 비즈니스에 차질이 빚어질 수 있다는 것이 업계의 분석이다.
AI 의존도 심화로 리스크 노출
전문가들은 이번 사태가 AI 서비스 의존도 증가에 따른 새로운 형태의 리스크를 보여준 사례라고 분석한다. AI가 실험적 도구에서 필수 업무 인프라로 자리잡으면서, 서비스 중단이 기업 운영에 미치는 영향도 커지고 있다는 것이다.
업계에서는 특히 금융, 의료, 제조업 등 업무 연속성이 중요한 분야에서 외부 AI 서비스 장애에 대한 대비책 마련 필요성이 제기되고 있다. 일부 기업들은 이미 복수의 AI 서비스를 동시 활용하거나, 자체 AI 시스템 구축을 검토하고 있는 것으로 알려졌다.
독립형 AI 솔루션 시장 관심 증가
이런 상황에서 자체 AI 인프라 구축 솔루션에 대한 관심도 높아지고 있다. 최근 여러 국내외 기업들이 온프레미스(On-Premise) AI 서버나 프라이빗 클라우드 기반 AI 솔루션을 잇따라 출시하고 있다.
DePIN 기반의 초소형 데이터센터 (NANODC) 전문기업 제타큐브도 지난달 온프레미스 AI 인프라 구축을 위한 통합 서버 솔루션 'SAI'를 출시했다. 주요 LLM 애플리케이션이 사전 설치된 형태로 제공되며, 완전 독립 운영형과 분산 네트워크 연결형 두 가지 옵션을 제공하고 있다.

OpenAI는 아직 이번 장애의 구체적인 원인을 공개하지 않았으며, 향후 재발 방지 대책에 대해서도 별도 입장을 밝히지 않고 있다.