엔비디아(NVDA)는 오늘 샌호세에서 열린 GTC 2026 개발자 컨퍼런스를 통해 데이터센터 운영자를 겨냥한 다양한 새로운 칩과 컴퓨팅 플랫폼을 발표했다. 주목할 만한 제품은 엔비디아의 최신 그래픽 처리 장치인 루빈이었지만, 다중 에이전트 워크로드를 처리하기 위한 새로운 그로크 3 언어 처리 장치가 가장 큰 영향을 미칠 수 있다.
엔비디아는 지난 12월 AI 추론 분야에서 혁신적인 프로세서를 개발한 스타트업 그로크(Groq Inc.)의 기술을 200억 달러(약 28조 8,000억 원)에 인수하면서 그들의 창립자인 조나단 로스와 사니 마드라를 합류시켰다. 불과 세 달 만에 이번 거래로 첫 번째 칩이 발표되었다.
그로크의 프로세서는 인공지능 모델을 실행하는 데 중점을 두며, 이는 모델을 훈련하는 것과는 다르다. 이는 GPU와는 달리 주로 AI 모델 훈련과 실행을 모두 수행하는 범용 칩과 차별화된다.
엔비디아의 초대규모 및 고성능 컴퓨팅 담당 부사장 이안 벅은 “GPU의 메모리가 크지만, 그로크 3는 더 빠른 메모리를 제공하여 저지연 작업 및 대규모 컨텍스트 수요를 지원하도록 설계됐다"고 말했다. 256개의 그로크 3 LPU로 구성된 전용 그로크 3 LPX 서버랙을 통해 이는 GPU를 능가하는 인퍼런스 처리 가속을 실현한다.
그로크 3 LPX는 최적화된 소프트웨어와 하드웨어로 이루어진 루빈 GPU와 베라 중앙 처리 유닛을 통합한 새로운 베라 루빈 NVL72 랙과 함께 사용할 수 있다. 이를 통해 전력, 메모리 및 연산 효율성을 극대화하며, 전력당 35배 더 높은 처리량과 10배 더 높은 수익 기회를 제공한다고 벅은 덧붙였다.
이번 발표로 엔비디아는 다중 에이전트 시스템 간의 빠른 상호작용을 강조하며 머리 위에 토큰 당 최대 1,500개의 처리 속도 지원을 목표로 한다. 이러한 기술적 진보는 대규모 데이터센터 수요 증가에 기여할 것이며, 엔비디아는 이를 기반으로 계속해서 시장을 선도할 전략을 고하고 있다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>