엔비디아(NVDA)가 2025 OCP 글로벌 서밋에서 차세대 AI를 위한 미래형 데이터센터 청사진을 공개했다. 그 중심에는 자사의 새로운 ‘기가와트 AI 팩토리’이며, 액체 냉각 기반의 오픈 구조 서버 아키텍처인 베라 루빈(Vera Rubin) NVL144이 핵심 역할을 한다.
베라 루빈 NVL144는 향후 출시될 차세대 GPU ‘Vera Rubin’ 시리즈를 위해 설계된 서버 랙 시스템이다. 전력 효율과 조립 속도를 극대화하기 위해 100% 액체 냉각 방식과 중앙 인쇄회로기판(midplane)을 채택했으며, 네트워킹 및 인퍼런스 기능을 확장 가능한 모듈 형태로 제공한다. NVL144의 설계는 오픈컴퓨트프로젝트(OCP)에 기증돼, 어느 기업이든 자사 데이터센터 구축 시 자유롭게 채택할 수 있다.
엔비디아는 NVL144 아키텍처가 AI 워크로드를 최적화하기 위해 800볼트 직류(DC) 기반 인프라로 설계됐다고 설명했다. 이 시스템은 열 효율성을 극대화하고 유지보수를 간소화하는 동시에, 20배 향상된 에너지 저장 능력을 갖춘 액체 냉각식 버스바를 통해 안정적인 전력 공급을 보장한다. 또한 상호 호환 가능한 모듈 구조 덕분에 다양한 제3자 부품과 결합해 미래 AI 연산 수요에 유연하게 대응할 수 있다는 점도 강점으로 꼽힌다.
이날 행사에서는 50개 이상의 기술 파트너가 베라 루빈 NVL144 지원을 공식화하며, 이 아키텍처가 표준으로 자리잡고 있다는 점을 부각시켰다.
엔비디아는 또 다른 데이터센터 설계인 ‘엔비디아 카이버(Kyber)’도 공개했다. 카이버는 향후 576개의 Vera Rubin GPU를 하나의 랙으로 연결할 수 있도록 설계된 고집적 서버 인프라다. 주요 특징으로는 GPU 블레이드를 수직적으로 배열해 같은 랙에 최대 18개 연산 블레이드를 장착할 수 있으며, 케이블 없이 운영되는 후방 네트워크 구조로 높은 데이터 전송 성능을 실현했다.
특히 카이버는 기존의 415V, 480V가 아닌 800V 직류(DC) 전력 체계를 채택해, 동일한 구리 배선으로 150% 이상 더 많은 전력을 전송할 수 있어 전력 전달 효율성을 획기적으로 개선했다. 엔비디아 측은 카이버가 향후 초대형 AI 데이터센터의 기반 설계 요소가 될 것이라고 전망했다.
한편 메타(Meta, FB)와 오라클(Oracle, ORCL)은 엔비디아의 최신 네트워크 스위치 ‘스펙트럼-X(Spectrum-X)’를 채택하며, 자사 데이터센터를 AI에 최적화된 형식으로 전환 중이라고 밝혔다. 스펙트럼-X는 AI 연산에 특화된 고속 이더넷 스위치로, 세계 최대 규모의 AI 슈퍼컴퓨터에서 이미 최대 95% 높은 데이터 처리 속도를 입증한 바 있다.
메타는 자사 네트워크 운영 플랫폼인 FBOSS에 스펙트럼-X를 통합할 예정이며, 이에 따라 대용량 모델 학습 효율이 즉각 개선될 것이라 기대하고 있다. 오라클 또한 이더넷 스위치를 기존 및 차세대 기가와트급 데이터센터에 채택해, 수백만 개의 GPU를 효율적으로 연결할 수 있는 신경망형 클라우드 인프라를 구축한다는 계획이다.
이번 발표는 전례 없는 규모의 AI 개발 요구에 대응하기 위한 엔비디아의 전략이 본격화되고 있음을 보여준다. AI 팩토리라는 새로운 데이터센터 개념은 단순한 저장 및 처리 공간을 넘어, AI에 특화된 지능형 생산 공장으로 진화하고 있으며, 엔비디아는 그 중심에서 생태계를 선도하고 있다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>