중국 인공지능 스타트업 문샷 AI가 최신 오픈소스 대형언어모델(LLM) ‘키미-K2.6’을 공개했다. 회사는 이 모델이 주요 인공지능 벤치마크에서 GPT-5.4와 클로드 오퍼스 4.6을 앞서거나 근소한 차이로 따라붙었다고 밝혔다.
키미-K2.6은 문샷 AI의 ‘키미’ 시리즈 최신작이다. 이번 모델은 텍스트뿐 아니라 이미지 등 멀티미디어 입력까지 처리할 수 있도록 설계됐다. 문샷 AI는 특히 효율성과 실제 작업 수행 능력에 초점을 맞췄다고 설명했다. 단순히 답변 품질만 높인 것이 아니라, 같은 연산 자원으로 더 복잡한 작업을 수행할 수 있도록 구조를 다듬었다는 의미다.
적은 자원으로 성능 높인 구조가 핵심
키미-K2.6은 ‘스위글루’로 불리는 활성화 함수를 적용했다. 이는 기존 방식보다 하드웨어 활용 효율이 높고, 모델 학습 과정도 일부 단순화할 수 있는 구조다. 이 방식은 이미 메타 플랫폼스의 라마 시리즈 등 여러 오픈소스 모델군에도 쓰이고 있다.
모델 내부에는 384개의 ‘전문가’ 네트워크가 배치됐다. 다만 사용자가 질문을 입력할 때마다 이 전체가 동시에 작동하는 것은 아니다. 실제 응답 생성에는 8개 전문가만 선택적으로 동원된다. 필요한 부분만 작동시키는 ‘전문가 혼합’ 방식으로, 연산량과 인프라 부담을 줄이는 데 유리하다.
여기에 ‘다중 헤드 잠재 어텐션(MLA)’ 기술도 탑재됐다. 이는 프롬프트에서 중요한 정보를 더 효율적으로 골라내는 주의집중 메커니즘의 일종이다. 데이터를 더 가벼운 수학적 표현으로 압축해 처리하기 때문에, 일반적인 어텐션 구조보다 하드웨어 요구량이 낮은 편이다.
이미지 이해·에이전트 협업 기능도 강화
키미-K2.6은 4억 개 파라미터 규모의 비전 인코더도 함께 갖췄다. 이 장치는 이미지를 모델이 이해하기 쉬운 ‘임베딩’ 형태로 바꿔준다. 덕분에 키미-K2.6은 문장 입력뿐 아니라 스케치나 시각 자료를 함께 받아 작업할 수 있다.
문샷 AI에 따르면 이 모델은 간단한 사용자 지시와 인터페이스 스케치만으로 완성형 웹사이트를 생성할 수 있다. 더 복잡하고 시간이 많이 드는 작업에서는 최대 300개의 에이전트를 동시에 투입할 수도 있다. 각 에이전트가 업무를 세부 단계로 나눠 병렬 처리하는 방식이라, 순차적으로 수행하는 것보다 속도를 높일 수 있다는 설명이다.
또 ‘클로 그룹’ 기능을 통해 사람과 에이전트가 함께 작업하도록 설계할 수도 있다. 문샷 AI는 이를 통해 프로젝트 내 업무를 인간 작업자와 인공지능 에이전트 사이에 분배할 수 있다고 설명했다. 회사는 전작 대비 러스트 개발 같은 일부 고난도 프로그래밍 작업에서도 성능이 개선됐다고 덧붙였다.
고난도 평가 HLE-Full서 GPT-5.4 앞섰다고 주장
문샷 AI는 키미-K2.6을 GPT-5.4, 클로드 오퍼스 4.6과 20개가 넘는 주요 벤치마크에서 비교했다고 밝혔다. 회사 주장에 따르면 새 모델은 다수의 테스트에서 두 선두권 모델을 앞서거나, 점수 차이를 몇 퍼센트포인트 이내로 좁혔다.
특히 가장 까다로운 평가 중 하나로 꼽히는 ‘HLE-Full’에서 키미-K2.6은 54점을 기록했다. 이 벤치마크는 100개가 넘는 학문 분야에 걸친 박사급 문제 약 2,500개로 구성된다. 같은 시험에서 클로드 오퍼스 4.6은 53점, GPT-5.4는 52.1점을 받았다고 문샷 AI는 밝혔다.
이번 발표는 오픈소스 인공지능 경쟁이 한층 치열해지고 있음을 보여준다. 폐쇄형 최상위 모델이 여전히 시장을 주도하고 있지만, 키미-K2.6처럼 효율성과 작업 자동화 기능을 함께 내세운 오픈소스 모델이 늘어나면서 기업과 개발자의 선택지도 더 넓어지는 흐름이다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

