엔비디아, 메타·오라클과 손잡고 'AI 슈퍼공장' 구축 시동

| 김민준 기자

엔비디아(NVDA)가 올해 오픈 컴퓨트 프로젝트 정상회의(Open Compute Project Summit)에서 발표한 ‘스펙트럼-X(Spectrum-X)’는 단순한 이더넷 솔루션을 넘어 AI 시대의 새로운 데이터센터 운영 체계를 제시하고 있다. 메타(META)와 오라클(ORCL)은 이 플랫폼을 통해 자사 AI 인프라에 본격적으로 통합하며, 이를 ‘메가 AI 팩토리’로 전환하겠다는 전략적 선택을 내렸다. 이는 단순한 네트워크 업그레이드가 아니라, 대규모 생성형 AI 훈련 및 추론을 위한 근본적인 인프라 개혁이기도 하다.

스펙트럼-X는 기존 이더넷을 AI 워크로드에 최적화한 구조로 재설계된 것이 핵심이다. 일반적인 네트워킹 스택과 달리, 이 플랫폼은 수백만 개의 GPU간 동기화, 고밀도 데이터 흐름, 낮은 지연 시간, 그리고 혼잡 제어 기능을 모두 지원한다. 엔비디아는 이 네트워크 시스템이 기존 이더넷 대비 1.6배 높은 성능을 제공하며, 결과적으로 GPU 활용도를 극대화하고 모델 훈련 시간을 대폭 단축할 수 있다고 강조했다.

메타는 자사 개방형 네트워크 운영체제 'FBOSS'와 ‘Minipack3N’ 스위치에 스펙트럼-X를 통합하면서 오픈소스 하드웨어와 AI 최적화 인프라의 결합을 실현했다. 특히 이 솔루션은 자사 트릴리언(1조) 파라미터급 모델을 위한 차세대 인프라의 핵심으로 자리매김할 전망이다. 메타의 네트워크 엔지니어링 부문 부사장 가야 나가라잔(Gaya Nagarajan)은 "AI 확장을 위해서는 유연하면서도 강력한 네트워크 기반이 필수"라며 스펙트럼-X 도입의 이유를 설명했다.

오라클은 보다 대규모 접근을 택했다. 스펙트럼-X를 활용해 향후 공개될 엔비디아 ‘베라 루빈(Vera Rubin)’ 아키텍처 기반의 글로벌 초대형 AI 팩토리를 구축할 계획이다. 오라클 클라우드 인프라 부문 부사장 마헤시 티아가라잔(Mahesh Thiagarajan)은 "스펙트럼-X는 전 세계 수백만 개의 GPU를 하나의 논리적 AI 시스템으로 연결하는 데 있어 핵심적인 역할을 한다"고 밝혔다. 특히 여러 데이터센터, 국가 간 병렬 연결을 실현하는 '스펙트럼XGS(SpectrumXGS)' 기능은 거대한 물리적 경계를 뛰어넘은 AI 확장을 가능하게 만들고 있다.

하드웨어 구성 면에서 이 시스템은 51.2테라비트/초 수준의 전송 속도를 자랑하는 스펙트럼4 스위치와 함께 블루필드3(BlueField-3) 슈퍼 NIC, DPU를 포함한다. 이는 네트워크 처리와 보안 기능을 오프로드하여 GPU가 연산에만 집중할 수 있는 환경을 만든다. 또한 통합된 텔레메트리, 적응형 라우팅, 고속 RDMA 등 고급 기능도 탑재돼 있다.

스펙트럼-X는 단순히 하드웨어 플랫폼에 머물지 않는다. 엔비디아의 DOCA, SONiC, NetQ, AI 워크벤치 등과 긴밀하게 통합돼 있으며, 이를 통해 모델 배포부터 운영에 이르는 전 과정을 하나의 스택으로 관리할 수 있다. 이처럼 AI 성능을 극대화하는 네트워크 중심 전략은 비용 효율성과 ROI를 동시에 끌어올릴 수 있다는 점에서 기업 입장에서 강력한 선택지가 되고 있다.

업계에서는 AI 모델 성능의 한계가 이제 연산 능력이나 에너지 효율이 아니라, 데이터를 얼마나 빠르고 효율적으로 이동시키는지에 달려 있다는 데 의견이 모이고 있다. 엔비디아의 스펙트럼-X는 바로 이 ‘연결성’에 있어 새로운 표준을 제시하면서, 데이터센터를 지능형 AI 공장으로 전환시키는 교두보 역할을 맡고 있다. 자율주행, 생성형 AI, 복잡한 추론 알고리즘 등 차세대 AI 워크로드가 네트워크 성능에 의존하게 되면서, 네트워크는 곧 ‘AI의 운영체제’가 되고 있다.

젠슨 황(Jensen Huang) 엔비디아 CEO는 “트릴리언 파라미터 모델이 몰고 온 변화는 단순한 규모 확장이 아니라, 데이터센터 자체를 메가 AI 공장으로 바꾼 것”이라며, “스펙트럼-X는 그 심장부를 이루는 신경망”이라고 강조했다. 이는 곧 엔비디아가 단순 GPU 공급자가 아닌, AI 인프라 전체의 중심으로 부상하고 있음을 방증한다.

결과적으로 메타와 오라클의 결정은 AI 인프라 분야에서의 근본적인 전환점으로 평가받는다. 이들은 스펙트럼-X를 통해 연산 자원을 집약하고, 지리적으로 분산된 AI 팩토리 간 통합을 실현함으로써 진정한 ‘AI 슈퍼컴퓨터 네트워크’를 만들어가고 있다. AI의 다음 도약은 연결에서 온다는 메시지가 점점 확실해지고 있다. 네트워크가 곧 컴퓨팅이며, AI의 오퍼레이팅 시스템으로써 그 중요성은 날로 커지고 있다.