엔비디아(NVDA)가 차세대 인공지능 모델군 '네모트론-3(Nemotron-3)'를 공개하며 오픈소스 생태계 강화에 방점을 찍었다. 이번 발표는 향후 에이전틱 AI의 기반을 다지는 핵심 전략으로, 고성능과 효율, 투명성을 모두 고려해 설계된 모델이라는 점에서 의미가 크다.
젠슨 황(Jensen Huang) 최고경영자(CEO)를 비롯한 경영진은 일관되게 오픈소스 기술이 AI 대중화의 핵심이라고 강조해왔다. 이번 네모트론-3 발표도 이런 철학의 연장선에 있다. AI 개발에 참여하는 전 세계 다양한 개발자와 기업의 진입 장벽을 낮추고, 공동 혁신을 유도하기 위한 포석이다.
네모트론-3는 단일 모델이 모든 상황을 커버하는 것이 아니라 다양한 형태의 모델이 조합돼야 최적화된 AI 시스템이 구현된다는 점에 착안해 설계됐다. 이를 위해 엔비디아는 크기와 기능이 서로 다른 세 가지 모델을 순차적으로 선보일 예정이다. 우선 출시된 300억 파라미터 규모의 '네모트론-3 나노(Nano)'는 실제 활성화 파라미터 수를 30억 개로 줄여 소형 GPU에서도 구동이 가능한 효율성을 제공한다. 내년 상반기에는 두 개의 H100 GPU에서 작동하는 '슈퍼(Super)'와 최고 성능을 위한 '울트라(Ultra)' 모델도 출시된다.
특히 주목할 점은 '1백만 토큰'이라는 문맥 길이(context length)다. 이 같은 긴 컨텍스트 처리는 AI가 수일간 이어지는 대화, 방대한 기술 문서, 전체 코드베이스 등과 같은 복잡한 데이터를 한 번에 분석하고 판단할 수 있는 역량을 의미한다. 이는 고급 추론 작업을 요구하는 에이전틱 AI 시스템에 매우 유리한 구조다.
또 하나 중요한 특징은 '긴 사고(long thinking)'라 불리는 고차원적 추론 과정을 보다 경제적으로 구현했다는 것이다. 일반적으로 깊은 사고를 위한 테스트 타임 컴퓨트는 연산량과 토큰 사용량을 폭발적으로 증가시키지만, 네모트론-3는 새로운 아키텍처로 이 비용을 대폭 줄였다.
엔비디아의 전략은 단순히 오픈 모델을 제공하는 수준을 넘는다. 이 회사는 강화학습 시뮬레이션 환경인 '네모짐(NeMo Gym)'도 함께 공개했다. 이는 기업과 개발자들이 모델을 실제 환경에서 훈련시키고 개선해 나갈 수 있도록 해준다. 예를 들어, 코딩, 수학, 일정 조정 등 실제 업무와 밀접한 과제를 해결하며 보상 설계를 통해 모델을 특화시킬 수 있다.
아울러 엔비디아는 데이터 부문에서도 새로운 기준을 제시했다. 3000억 개 이상의 고품질 토큰을 포함한 프리트레이닝 데이터셋, 사후 학습용으로 1300만 샘플의 안전한 인스트럭션 데이터셋, 90만 개의 강화학습 태스크 샘플 등, 모델 성능 향상에 필요한 핵심 데이터를 모두 공개했다. 특히 서비스나우(ServiceNow)는 차세대 모델인 ‘Apriel 1.6 Thinker’의 프리트레이닝 데이터 중 15%가 네모트론 기반에서 활용됐다고 밝혔다.
엔비디아는 이번 발표를 통해 오픈소스 AI 생태계의 확장을 넘어서, 실질적인 비즈니스 적용 가능성을 염두에 둔 AI 블루프린트도 함께 제안했다. 대표적으로 전문가용 연구 보조 도구 ‘IQ 딥 리서처(Deep Researcher)’, 다단계 동영상 분석 플랫폼, 엔터프라이즈용 RAG(Retrieval-Augmented Generation) 프레임워크 등이 있다.
AI 산업이 과도기를 지나 실질적인 적용 단계로 진입함에 따라, 이제는 퍼포먼스와 효율, 오픈소스 생태계라는 세 가지 축을 모두 갖춘 기술이 시장을 주도할 가능성이 높아졌다. 네모트론-3는 정확히 그 기준에 부합하며 엔비디아가 기술 민주화를 기치로 AI의 방향성을 주도하겠다는 의지를 다시 한번 확인시켰다.




