AI 데이터센터에서 가장 큰 고민 중 하나는 ‘연결’이다. 반도체 간 데이터 이동이 지연되면 값비싼 AI 가속기가 일을 하지 못한 채 대기하게 되는데, 아스테라랩스가 이를 줄이기 위한 신규 스위치 제품군을 내놨다.
네트워킹 칩 업체 아스테라랩스(Astera Labs)는 최신 ‘스콜피오 X시리즈’ 스마트 데이터 패브릭 스위치를 공개했다고 밝혔다. 회사는 이 제품을 업계 최대 규모의 개방형 ‘메모리-시맨틱’ 패브릭 스위치라고 소개했다. 하이퍼스케일 데이터센터 운영사가 연산 자원을 더 크게 확장하면서도 지연 시간 문제를 줄이는 데 초점을 맞췄다는 설명이다.
이번 출시와 함께 기존 ‘스콜피오 P시리즈’ PCIe 패브릭 스위치 제품군도 확대됐다. 새 P시리즈는 32레인부터 320레인까지 다양한 구성으로 제공된다. AI 프로세서 클러스터 사이에서 대규모 데이터를 효율적으로 이동시켜야 하는 데이터센터 설계자에게 선택지를 넓혀주는 셈이다.
초거대 AI 시대, 병목은 GPU가 아니라 데이터 이동
아스테라랩스는 AI 시스템 확장에서 이제 핵심 문제는 단순한 칩 성능이 아니라 칩 간 연결 효율이라고 보고 있다. 최근 대형언어모델은 수조 개 매개변수를 갖춘 초대형 구조로 커지고 있어, 단일 서버 랙 안에 모든 연산을 담기 어려워졌다. 결국 수백, 수천 개의 그래픽처리장치(GPU)를 하나의 거대한 클러스터로 묶어 운영해야 한다.
문제는 이 과정에서 데이터가 칩 사이를 끊임없이 오가며 혼잡이 커진다는 점이다. 필요한 데이터가 다른 구간에서 도착하길 기다리는 동안 GPU는 유휴 상태에 머문다. 시간당 수천 달러, 원화로는 수백만 원에 이르는 AI 클러스터 운영 비용을 감안하면 이런 대기 시간은 데이터센터 수익성과 효율을 크게 떨어뜨리는 요소다.
‘메모리처럼’ 접근하는 패브릭…지연 줄이고 처리 효율 높인다
주력 제품인 ‘스콜피오 X시리즈 320레인 스마트 패브릭 스위치’는 스위치와 칩의 상호작용 방식을 다시 설계한 것이 특징이다. 이 제품은 ‘메모리-시맨틱’ 아키텍처를 기반으로, GPU와 기타 AI 가속기가 패브릭 전반에 흩어진 자원에 단순한 로드·스토어 방식으로 접근할 수 있게 설계됐다. 쉽게 말해 원격 자원을 마치 자신이 가진 로컬 메모리처럼 다룰 수 있도록 만든 구조다.
이렇게 되면 패브릭 전체가 하나의 통합 메모리 풀처럼 동작하게 된다. 기존 데이터 패킷 변환 과정에서 생기던 오버헤드를 줄여 지연 시간을 낮추는 효과를 기대할 수 있다. AI 데이터센터 입장에서는 동일한 연산 자원으로 더 많은 작업을 처리할 가능성이 커지는 셈이다.
또한 이 제품에는 아스테라랩스의 자체 기술인 ‘하이퍼캐스트’와 ‘인-네트워크 컴퓨트’가 적용됐다. 스위치가 단순히 데이터를 전달하는 데 그치지 않고 일부 처리 작업을 직접 수행하는 구조다. 특히 데이터 집계나 분배 같은 ‘집단 연산’을 네트워크 단계에서 처리할 수 있어, 회사는 관련 작업이 기존보다 최대 2배 빨라질 수 있다고 설명했다. 이는 AI 워크로드의 ‘토큰 경제성’, 즉 단위 비용당 처리 효율에도 직접적인 영향을 줄 수 있다.
320레인 고밀도 설계로 기존 스위치 대체…개방형 표준도 지원
스콜피오 X시리즈의 또 다른 강점은 ‘하이 래딕스’ 설계다. 칩 하나에 PCIe 6 기반 320레인 연결성을 제공해, 여러 개의 기존 데이터센터 스위치를 대체할 수 있다는 설명이다. 네트워크 구조가 단순해지고 데이터가 이동해야 하는 물리적 거리도 줄어들어 전체 시스템 복잡성을 낮출 수 있다.
확장된 스콜피오 P시리즈는 X시리즈를 보완하는 역할을 맡는다. 아스테라랩스는 이들 제품이 프런트엔드 네트워크와 AI 연산 시스템 구축을 함께 지원하도록 설계됐다고 밝혔다. 여기에 개방형 표준은 물론 엔비디아의 NV링크 퓨전(NVLink Fusion), UALink 같은 플랫폼별 프로토콜도 지원해 사실상 다양한 AI 프로세서에 적용 가능한 네트워킹 패브릭을 제공할 수 있다고 강조했다.
지텐드라 모한 최고경영자(CEO)는 “오늘날 가장 까다로운 AI 애플리케이션을 이끄는 프런티어 모델은 이를 구동하는 가속기 성능에 걸맞은 연결 인프라를 필요로 한다”고 말했다. AI 산업이 계속 커지려면 칩 연결 병목을 피해야 한다는 의미다.
아스테라랩스의 이번 발표는 AI 경쟁의 초점이 반도체 성능 자체에서 시스템 전체의 연결 구조로 빠르게 이동하고 있음을 보여준다. 앞으로 AI 데이터센터에서는 더 빠른 칩만큼이나, 그 칩들을 얼마나 효율적으로 묶어낼 수 있는지가 핵심 경쟁력이 될 가능성이 크다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.
