AI 데이터센터 필승 전략… 델, 'SONiC+스펙트럼-X'로 네트워크 혁신

| 김민준 기자

기업들이 성능 최적화된 고성능 컴퓨팅 인프라를 활용해 폭증하는 인공지능(AI) 수요에 대응하는 과정에서, AI 네트워킹이 데이터센터의 ‘중추신경계’로 떠오르고 있다. 델 테크놀로지스(Dell Technologies)의 AI 네트워크 전략 책임자인 소라브 카푸어에 따르면, 기존 이더넷 연결로는 AI 워크로드가 요구하는 속도와 안정성을 동시에 충족시키기 어렵기 때문에 새로운 방식의 네트워크 설계가 필수적이다.

AI 기반 업무의 특성은 매우 다르다. 데이터 전송량이 한순간 급증하는 ‘엘리펀트 플로우(elephant flow)’, 매우 낮은 엔트로피를 가진 데이터 흐름 등 복잡한 특성을 지니고 있다. 기존 네트워크 환경에서는 거의 즉시 포화 상태에 도달할 수 있고, 이로 인해 수백억 원 규모의 GPU 리소스가 유휴 상태로 방치되는 이른바 ‘GPU 정체 현상’마저 발생할 수 있다. 이러한 문제에 대응하기 위해 델은 오픈소스 기반의 ‘SONiC(Software for Open Networking in the Cloud)’를 토대로 고성능 이더넷 패브릭 아키텍처를 확산하고 있다.

카푸어는 "과거 리눅스가 서버 운영체제의 표준으로 자리 잡은 것처럼, 네트워킹에서도 SONiC이 사실상의 표준으로 자리잡고 있다"고 밝혔다. 하드웨어와 소프트웨어를 분리하고 일관된 오픈소스 플랫폼을 적용하면 소유비용을 최대 50%까지 절감할 수 있으며, 절약된 비용은 고가의 GPU 확보에 재투자할 수 있다.

이와 동시에 델은 SONiC의 기업용 버전을 엔비디아(NVDA)의 고속 이더넷 플랫폼 ‘스펙트럼-X(Spectrum-X)’와 통합했다고 발표했다. 이를 통해 기업들은 하이퍼스케일러 수준의 고속 네트워크 인프라를 동일한 수준으로 구현하면서도 기업 환경에 적합한 지원과 검증 기능도 확보할 수 있게 됐다.

AI 팩토리 등 신속한 인프라 구축이 중요한 고객을 위해 델은 ‘스마트패브릭 매니저(SmartFabric Manager)’라는 솔루션도 선보였다. 이 도구는 검증된 블루프린트를 기반으로 팩토리 구축을 자동화하며, 네트워크와 컴퓨팅 자원 사이의 상호작용을 예측하는 분석 기술도 포함돼 있어 운영 효율을 획기적으로 끌어올릴 수 있다.

카푸어는 "네트워크 대역폭과 연산 성능 간의 상관관계를 분석하면서, 예측 기반 조치가 가능한 수준의 인프라를 구축해야 한다"고 강조했다. 이어 "AI 훈련, 추론, 파인튜닝 등 전방위 AI 워크로드를 소화할 수 있는 완벽한 자동화 기반의 구조가 본격 확산될 시점"이라고 덧붙였다.

이처럼 AI 시대의 네트워크는 단순한 통신 인프라가 아니라, AI 운용의 속도와 효율을 좌우하는 핵심 요소로 부상하고 있다. AI팩토리의 실효성을 극대화하기 위한 전략적 선택이 이제 기업의 경쟁력을 좌우할 전망이다.