중국 인공지능 스타트업 문샷AI가 새로운 오픈소스 언어 모델 ‘Kimi K2’를 공개하며 생성형 AI 시장에 본격적인 도전을 선언했다. GPT-4 등 미국 대형 기업들의 독점 모델들과 비교해도 기술력 면에서 결코 뒤지지 않는 성능을 보여주며, AI 산업 전반에 파장을 일으키고 있다.
Kimi K2는 총 1조 개에 달하는 파라미터 수를 기반으로 한 ‘미크스처 오브 엑스퍼츠(MoE)’ 구조를 채택했다. 활성화되는 파라미터는 320억 개로, 대규모 작업을 수행하면서도 효율성은 유지하는 최적화가 특징이다. 문샷AI는 이 모델을 두 버전으로 공개했다. 하나는 연구자와 개발자를 위한 ‘파운데이션 모델’, 또 하나는 채팅 및 자율 에이전트 활용에 특화된 ‘인스트럭션 튜닝’ 버전이다.
Kimi K2의 가장 인상적인 부분은 ‘에이전틱(intelligent agentic)’ 기능 최적화에 있다. 복잡한 다단계 작업을 툴 사용 및 코드 실행을 통해 자율적으로 수행하는 능력은 기업용 AI가 필요로 하는 핵심 역량이다. 실제 벤치마크 테스트에서 SWE-bench Verified 지표에서 65.8% 정확도를 기록하며, 다수의 오픈모델은 물론 일부 상용 모델까지 능가하는 성과를 냈다.
또 다른 주요 테스트인 LiveCodeBench에서는 53.7%의 정확도를 기록해, GPT-4.1의 44.7%를 큰 격차로 앞섰다. 수학 분야에서는 MATH-500 벤치마크에서 GPT-4.1보다 5% 높은 97.4%의 정답률을 기록했는데, 이는 AI 분야에서 가장 어려운 연산 추론 측면에서 문샷이 타 경쟁사와 획기적인 차이를 만들어냈다는 평가다.
흥미로운 점은 문샷AI가 이 방식들을 거대 자본 없이 구현했다는 것이다. GPT-4를 개발한 오픈AI(OpenAI)가 모델 한 번 훈련에 수천억 원을 소모하는 반면, 문샷은 비용 대비 효율을 극대화한 것으로 보인다. 이 과정의 핵심에는 문샷 자체가 개발한 최적화 기법 ‘뮤온클립(MuonClip)’이 있다. 이 기법은 현재 대형 언어 모델 학습 시 흔히 발생하는 불안정성을 제거해, 재학습 없이도 안정적인 성능을 확보하게 한다. 이는 AI 훈련 비용을 근본적으로 줄이면서도 품질을 유지할 수 있음을 보여준다.
문샷AI는 놀랍게도 이 모델을 오픈소스로 공개하면서 동시에 상업용 API를 매우 낮은 가격으로 제공하기 시작했다. 입력 토큰은 백만 단위 당 0.15달러(약 220원), 출력 토큰은 같은 기준으로 2.50달러(약 3,600원)다. 이는 오픈AI나 앤트로픽(Anthropic)의 고가 정책에 정면으로 도전하는 파격적인 전략이다. 기업들은 API를 통해 모델을 즉시 활용할 수 있고, 필요에 따라 자가 호스팅으로 전환해 비용과 보안 측면에서 유연하게 대응할 수 있다.
해당 전략은 단순한 오픈소스 제공을 넘어 고객 유입과 생태계 확장을 동시에 노리는 치밀한 계산이다. 전 세계 개발자들이 Kimi K2를 활용하고 기여할수록 문샷의 개발 비용은 줄고, 기술 완성도는 높아지는 구조다. 마치 커뮤니티 중심의 오픈소스 파급력을 새로운 세대 AI에도 적용한 셈이다.
문샷AI가 공개한 실제 데모 사례도 주목할 만하다. 런던 콘서트 플래너 예제에서는 Kimi K2가 일정 조정, 항공권 검색, 식당 예약 등의 작업을 17개의 도구 호출만으로 자율적으로 수행했다. 이는 단지 대화를 이어가는 챗봇이 아니라, 복잡한 지식 노동 흐름을 자신이 직접 이해하고 처리하는 진짜 사용자형 AI로의 전환을 의미한다.
이 같은 변화는 단순히 모델 성능 향상을 넘어 인공지능 활용 철학 자체를 전환하는 신호탄이다. GPT 계열 모델들이 인간처럼 말하는 데 집중했다면, 문샷AI는 실제로 일을 처리할 수 있는 AI에 집중했다. 이는 많은 기업 고객들이 더 이상 실험적인 AI가 아닌 실질적인 생산성 도구를 기대하고 있다는 점에서 결정적인 차별점이 된다.
Kimi K2의 등장은 오픈소스 AI가 오픈AI와 앤트로픽 같은 선도 기업을 따라잡고 있다는 확실한 신호다. 단일 분야에 특화된 이른바 ‘GPT 킬러’와는 달리, Kimi K2는 코드 작성, 수학 문제 해결, 도구 사용, 단독 업무처리 등 일반지능을 구성하는 거의 모든 요소에서 고른 성능을 보이고 있다. 동시에 누구든 다운로드해 직접 활용하거나 수정할 수 있다는 개방성까지 갖췄다.
현재 GPT-4와 클로드(Claude)에 의존해온 기업 고객은 이제 더 저렴하면서도 비슷하거나 뛰어난 성능을 내는 대안을 앞에 두게 됐다. 문샷은 이러한 전환기를 정확히 포착해 Kimi K2를 시장에 던졌다. 핵심 기술의 우위가 점점 옅어지는 시대, 경쟁력은 효율적인 배포와 비용 전략으로 옮겨가고 있다. Kimi K2는 그 변화의 한가운데에서 독보적인 위치를 확보하고 있다.
문샷이 밝힌 대로, “Kimi K2는 단지 답하지 않는다. 행동한다.” 이 말은 지금의 AI 경쟁에서 가장 본질적인 질문을 던진다. 더 인간 같은 대화가 중요한가, 아니면 더 인간처럼 일을 잘하는 AI가 필요한가. 현재로서는 후자가 AI의 미래로 보인다.