인공지능(AI) 인프라가 수만 개 수준을 넘어 ‘백만 GPU’에 가까운 초대형 클러스터로 확장되면서 데이터센터 네트워크 경쟁 구도도 빠르게 바뀌고 있다. 그동안 인피니밴드와 이더넷의 대결은 성능 대 보급성의 싸움으로 요약됐지만, 최근에는 이더넷이 성능 격차를 상당 부분 좁히며 AI 슈퍼시스템의 핵심 기반으로 올라서는 흐름이 뚜렷해졌다.
이런 변화 속에서 아리스타네트웍스($ANET)는 11일 브로드컴($AVGO)의 ‘토마호크 6’ 실리콘을 적용한 1.6테라비트급 ‘7060XE7’ 시리즈 스위치를 공개했다. 최대 100테라비트/초 스위칭 용량과 224G SerDes 기술이 전면에 나섰지만, 이번 발표의 핵심은 단순한 속도 경쟁보다 ‘랙 단위 통합’, 개방형 표준, 그리고 기업·티어2 시장 공략에 있다는 평가가 나온다.
개별 장비에서 ‘랙 단위 시스템’으로
과거 네트워크 장비 업체들은 스위치를 독립된 박스나 섀시 형태로 판매했고, 고객은 리프-스파인 구조를 더해 네트워크를 확장했다. 그러나 생성형 AI 확산으로 전력 밀도와 발열 부담이 급격히 커지면서, 이제 개별 스위치만으로는 효율적인 확장이 어려워졌다.
아리스타네트웍스는 이에 맞춰 랙 스케일 시스템 설계로 무게중심을 옮기고 있다. 대표 사례가 액체 냉각 기반 ‘7060XE7-64PRS-RV3-L’ 모델이다. 이 장비는 오픈랙 v3 규격에 맞춰 설계된 2OU 시스템으로, 내부 팬 없이 랙 전원 버스바에서 직접 DC 전력을 공급받는다. 액체 냉각 XPU 서버 환경에 직접 들어가도록 설계돼 유체 흐름까지 서버와 맞춘 것이 특징이다.
팬을 없애면 전력 효율 개선 효과도 크다. 일반 공랭식 환경에서는 공기를 움직이는 데만 전체 전력의 30~50%가 추가로 들어갈 수 있지만, 통합 액체 냉각 랙 구조에서는 이 부담이 5~15% 수준으로 낮아질 수 있다는 설명이다. 전력 공급이 병목인 데이터센터에서는 절감한 전력을 더 많은 GPU 운영에 돌릴 수 있다는 점에서 실질적인 의미가 크다.
광모듈 전략, CPO 대신 LPO에 무게
고성능 네트워킹 시장에서는 공동 패키지 광학(CPO)과 플러그형 광학 모듈 중 어느 쪽이 유리한지를 두고 논쟁이 이어져 왔다. CPO는 광 엔진을 실리콘 가까이에 붙여 초고속 환경의 전력 문제를 줄일 수 있다는 장점이 있지만, 일부 광 레인이 고장 나도 대규모 시스템 전체에 영향을 줄 수 있어 유지보수 부담이 크다.
아리스타네트웍스는 이번 1.6T 세대에서 선형 플러그형 광학(LPO)을 강화했다. 회사는 신호 무결성 설계와 광모듈 내 전력 소모가 큰 DSP 제거를 통해 상호연결 전력 사용량을 약 60% 줄일 수 있다고 주장했다.
이는 총소유비용(TCO)에 직접 연결된다. 광모듈 전력 소모가 낮아지면 스위치 발열이 줄어 팬 회전 부담이 완화되고 부품 수명도 늘어날 수 있다. 동시에 대규모 AI 클러스터에서 하나의 포트만 교체하면 되는 플러그형 구조는 장애 대응 유연성을 높인다. 값비싼 AI 학습 작업은 네트워크 다운타임에 민감한 만큼, 전력 효율과 유지보수성을 함께 잡으려는 전략으로 읽힌다.
다만 LPO와 CPO는 각각 장단점이 뚜렷해 어느 한쪽이 절대적으로 우월하다고 보긴 어렵다. 실제 도입은 고객의 전력, 냉각, 운영 역량에 따라 달라질 가능성이 높다.
‘스케일업’ 시장까지 확장
이번 발표에서 눈에 띄는 부분은 아리스타네트웍스가 ‘스케일아웃’뿐 아니라 ‘스케일업’ 영역까지 본격 진입했다는 점이다. 스케일아웃은 수천 개 노드를 잇는 전통적인 백엔드 패브릭이고, 스케일업은 하나의 컴퓨트 복합체 내부에서 매우 촘촘하게 연결되는 구조를 뜻한다.
그동안 스케일업 시장은 엔비디아($NVDA) NVLink 같은 독자 기술의 영향력이 컸다. 하지만 AMD($AMD), 인텔($INTC), 하이퍼스케일러의 자체 칩을 포함한 비(非)엔비디아 생태계가 커지면서, 이더넷 기반의 개방형 스케일업 아키텍처 수요도 함께 확대되고 있다.
아리스타네트웍스는 브로드컴 토마호크 6의 높은 온칩 연결성을 바탕으로 파트너사 GPU 블레이드 특성과 기구 설계에 맞춘 맞춤형 스케일업 솔루션을 제공하겠다는 구상이다. 이는 특정 벤더 종속성이 강한 컴퓨트 패브릭에 맞서는 개방형 대안으로 해석된다.
스케일아웃 영역에서도 확장성이 강조됐다. 회사는 7060XE7 리프 스위치와 대용량 버퍼를 갖춘 7800 AI 스파인 섀시를 결합해 2계층 네트워크를 구성하면, 기존 고정형 장비 중심 구조보다 최대 4.5배 많은 GPU를 지원할 수 있다고 밝혔다. AI 집단 통신에서 자주 발생하는 ‘패킷 마이크로버스트’를 완화하는 데도 이런 저지연 평면 구조가 중요하다는 설명이다.
기업 시장 확산의 신호탄
현재 1.6T급 대역폭의 주 수요처는 하이퍼스케일러와 최전선 AI 연구소다. 다만 금융 헤지펀드, 자동차 시뮬레이션, 바이오 연구, 국가 단위 클라우드처럼 고성능 연산 수요가 큰 산업군에서도 비슷한 흐름이 감지된다. 이들은 백만 GPU 클러스터를 짓는 단계는 아니지만, 워크로드 규모가 빠르게 수천 노드 수준으로 커지고 있다.
문제는 이런 조직들이 메타플랫폼스($META)나 마이크로소프트($MSFT)처럼 자체 네트워크 프로토콜을 처음부터 설계할 만큼 대규모 엔지니어링 조직을 갖추지 못했다는 점이다. 결국 성능 못지않게 운영 소프트웨어의 완성도가 중요해진다.
아리스타네트웍스는 동적 부하분산, 다중경로 신뢰 연결, 패브릭 복원력, 하드웨어 수준 혼잡 신호 같은 기능을 자사 EOS에 통합해 제공하고 있다. 대형 클라우드 업체와 함께 다듬은 최적화 기능을 검증된 기업용 설계 형태로 제공함으로써, 고성능 AI 네트워크 구축의 복잡성을 낮추려는 전략이다.
인피니밴드는 남고, 성장의 축은 이더넷
시장에서는 인피니밴드가 당분간 고성능 AI 환경에서 중요한 위치를 유지할 것이라는 시각이 우세하다. 다만 향후 성장의 중심축은 이더넷으로 이동할 가능성이 크다는 분석도 힘을 얻고 있다. 기업들이 학습과 추론 환경에서 여러 XPU 공급업체 제품을 혼용하기 시작하면서, 특정 컴퓨트 실리콘에 종속되지 않는 개방형 네트워크 패브릭 수요가 커지고 있어서다.
이번 1.6T 발표는 이더넷이 더 이상 인피니밴드를 뒤쫓는 기술이 아니라는 점을 보여준다. AI 인프라 시대에 필요한 집적도, 전력 효율, 운영 소프트웨어를 갖추며 차세대 데이터센터의 표준 후보로 빠르게 자리 잡고 있다는 의미다. 업계의 오래된 승부가 이제는 속도 경쟁을 넘어, ‘누가 더 유연하고 효율적인 AI 시스템을 만들 수 있느냐 TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

