샤오미, 오픈AI 뛰어넘는 AI 추론 모델 'MiMo-7B' 전격 공개

김민준 기자

2025.05.01 (목) 05:26

샤오미가 오픈AI 모델을 능가한다고 주장하는 신형 AI 모델 'MiMo-7B'를 공개했으며, 딥시크도 수학 특화 모델을 선보였다. 두 기업 모두 고급 추론 역량을 무기로 중국발 AI 경쟁력을 강화하고 있다.

샤오미, 오픈AI 뛰어넘는 AI 추론 모델 'MiMo-7B' 전격 공개 / TokenPost Ai

샤오미가 새로운 오픈소스 AI 추론 모델군 ‘MiMo-7B’를 공개하며 인공지능 기술 고도화 경쟁에 본격적으로 뛰어들었다. 중국 AI 생태계의 발전을 상징하는 이번 발표는 수학 문제 해결에 초점을 맞춘 딥시크의 최신 버전 ‘Prover-V2’와 함께 발표돼 주목받고 있다.

MiMo-7B 시리즈는 약 70억 개의 매개변수를 가지며, 기본 모델과 함께 출력 품질이 향상된 세 가지 고성능 버전이 포함되어 있다. 샤오미는 이 고급 모델들을 ‘지도 학습 기반 미세조정’과 ‘강화 학습’이라는 두 가지 기계학습 기술을 활용해 개발했다. 특히 두 방식을 융합한 모델은 오픈AI의 소형 추론 모델 o1-mini를 능가하는 코드 생성과 수학 문제 해결 역량을 갖췄다고 주장했다.

샤오미 연구진은 이번 모델의 성능을 직접 입증하기 위해 실행한 강화 학습 실험에서, MiMo-7B 기본 모델이 320억 매개변수 규모의 대형 모델을 능가하는 추론 역량을 보였다고 강조했다. 해당 모델은 오픈소스 라이선스로 배포되며, 소프트웨어 개발자와 연구자들에게 다양한 활용 가능성을 제시하고 있다.

같은 날, 경쟁사 딥시크도 수학 추론 능력에 최적화된 오픈소스 AI 모델 ‘Prover-V2’를 조용히 업데이트했다. 이 모델은 지난해 출시된 오리지널 Prover의 연장선상에서, 기존 수학 정리와 증명을 고도화된 언어모델 두 개로 재구성하고, 그 과정을 학습에 적용하는 다단계 절차를 거쳐 개발됐다. 딥시크는 Prover-V2가 비공식·공식 추론 방식을 통합한 형태로 진화했다고 밝혔다.

이번 발표는 불과 며칠 전 알리바바가 공개한 대규모 이유 기반 AI 모델군 ‘Qwen3’ 출시에 이어 나온 것이다. Qwen3는 6억에서 2350억 개까지의 매개변수를 갖춘 모델들을 포함하며, 샤오미와 딥시크, 그리고 오픈AI의 기존 모델보다도 두각을 나타낸다고 알리바바는 강조한 바 있다.

중국 AI 기술이 급속도로 진화하는 가운데, 추론 역량을 핵심 경쟁력으로 내세운 신형 오픈소스 모델들이 글로벌 AI 생태계 전반에 심대한 영향을 미칠 것으로 보인다. 샤오미와 딥시크는 각각 광범위한 문제 해결 능력과 수학 전문 영역에서의 정밀성을 겨냥하며 AI 기술의 다양화를 주도해 나가고 있다.

뉴스를 실시간으로...토큰포스트 텔레그램 가기

광고문의 기사제보 보도자료

#샤오미 #딥시크 #AI모델 #추론AI #오픈소스AI