생성형 인공지능(AI)의 대중화와 더불어 데이터센터 네트워크 성능의 한계가 주목받는 가운데, AI 컴퓨팅 스타트업 디매트릭스(d-Matrix)가 초고속 AI 추론을 위한 전용 네트워크 카드 ‘제트스트림(JetStream)’을 새롭게 공개했다.
제트스트림은 AI 추론에 최적화된 PCIe Gen5 기반 네트워크 카드로, 400Gbps의 최대 대역폭을 제공하면서 기존 이더넷 스위치와 완벽하게 호환된다. 데이터센터 인프라를 교체하지 않고도 고성능 AI 네트워크 환경을 구축할 수 있다는 점에서 업계의 주목을 받고 있다. 디매트릭스는 이를 통해 대규모 멀티모달 AI 모델을 실시간으로 처리할 수 있는 기반을 제공한다고 설명했다.
디매트릭스의 공동 창업자이자 CEO인 시드 셰스(Sid Sheth)는 “AI 기술의 진화를 따라잡기 위해선 단순한 연산 능력만으로는 부족하다”며, “제트스트림은 기존의 코르세어(Corsair) 추론 가속기와 결합해 AI 시스템의 확장성과 성능을 동시에 개선할 수 있는 새로운 해법”이라고 강조했다.
회사 측에 따르면 코르세어 플랫폼은 기존 GPU 기반 솔루션보다 더 빠른 통합 메모리 처리 성능을 제공하며, 특히 대규모 AI 추론 워크로드에서 비용 대비 효율성과 확장성이 뛰어나다는 평가를 받고 있다. 제트스트림 역시 이러한 컴퓨팅 인프라의 병목, 특히 네트워크 병목현상 해소를 위한 핵심 장비로 자리매김하고 있다.
제품 개발을 총괄한 스리 가네산(Sree Ganesan) 제품 부사장은 “전 세계 고객사들은 복잡한 인공지능 처리를 위해 기존 장비와의 호환성을 가장 중요하게 여긴다”며, “디매트릭스는 플러그앤플레이 방식으로 기존 환경에서 빠르게 구축 가능한 구조를 선택했고, 이는 이더넷 스위치를 교체하지 않아도 되는 커다란 장점이 있다”고 설명했다.
또한 제트스트림은 디매트릭스의 소프트웨어 플랫폼 ‘에비에이터(Aviator)’와도 완벽히 통합돼, GPU 기반 시스템 대비 최대 10배 빠른 속도는 물론, 에너지 효율성과 총 소유비용(TCO)을 각각 세 배 이상 개선할 수 있는 것으로 나타났다.
현재 제트스트림의 샘플은 이미 제공되고 있으며, 본격적인 양산은 연말까지 시작될 예정이다. AI 추론 효율성과 데이터센터 운영의 경제성을 개선하려는 기업들에겐 매력적인 대안이 될 전망이다.