엔비디아가 영상·음성·이미지·텍스트를 통합 처리하는 오픈소스 멀티모달 모델 'Nemotron 3 Nano Omni'를 출시했다고 Odaily가 보도했다.
엔비디아는 X를 통해 이 모델이 30B-A3B 혼합전문가(MoE) 아키텍처와 256K 컨텍스트를 지원하며, 동급 상호작용 성능의 오픈소스 범용 모델과 비교해 처리량이 최대 9배 높다고 밝혔다. 이에 따라 추론 비용을 낮추고 확장성을 높일 수 있다고 설명했다.
현재 Nemotron 3 Nano Omni는 허깅페이스, 오픈라우터, 엔비디아 NIM에서 사용할 수 있다. Aible, Applied Scientific Intelligence, H Company 등 기업들도 이미 채택한 것으로 전해졌다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사