엔비디아가 비밀리에 인공지능 추론용 칩을 개발 중이며, 다음 달 출시될 가능성이 있다고 월스트리트저널이 보도했다. 이 추론 칩은 OpenAI 그룹을 포함한 여러 인공지능 업체들이 더 빠르고 효율적인 모델을 개발하는 데 활용될 예정이다. 이번 신제품은 엔비디아의 연례 GTC 개발자 행사에서 공개될 것으로 예상되며, 작년 12월 칩 스타트업 Groq로부터 획득한 기술이 통합될 예정이다.
AI 산업에서 추론은 훈련된 모델을 실제 환경에 적용하는 핵심 분야로 부상했다. 구글과 아마존 웹 서비스 등 경쟁사들도 이미 특화된 추론 칩을 개발해 엔비디아와 경쟁을 벌이고 있으며, Cerebras Systems와 SambaNova Systems 같은 스타트업도 도전장을 내밀고 있다.
OpenAI는 엔비디아의 새로운 칩을 가장 먼저 도입할 업체 중 하나로 알려졌으며, 이는 엔비디아에 큰 성과로 평가된다. 엔비디아가 지난주 OpenAI에 300억 달러(약 43조 2,000억 원)를 투자함에 따라 이들의 굳건한 협력 관계가 더욱 공고해졌다.
엔비디아는 GPU 시장을 지배하고 있으며, 이들은 복잡한 연산 작업에 뛰어난 성능을 보인다. 그러나 GPU의 높은 에너지 소비로 인해 AI 응용프로그램을 위한 최적의 선택으로 여겨지지는 않고 있다. OpenAI는 이런 문제를 극복하기 위해 Cerebras와 수십억 달러 계약을 체결했다.
엔비디아는 Groq에서 개발된 기술을 채택하여 이번 신제품에 적용할 계획이며, Groq는 낮은 에너지 사용을 자랑하는 "언어 처리 단위"로 알려져 있다. OpenAI는 이 칩을 사용해 자체 코딩 도구인 Codex를 강화하려 하고 있으며, 이는 시장에서 높은 평가를 받는 Anthropic의 Claude Code와 경쟁할 예정이다.
엔비디아의 CPU도 AI 작업에서 새로운 대안으로 주목받고 있다. 메타는 최근 이 CPU를 활용해 대규모 AI 작업을 진행하기로 결정하며, GPU와의 조합 없이 단독 사용을 시도할 계획을 밝혔다. 이는 엔비디아의 CPU가 에너지 효율성에서도 인정을 받고 있음을 보여준다.





