프랑스 AI 스타트업 미스트랄(Mistral)이 다시 한 번 오픈소스 AI 생태계에 존재감을 각인시켰다. 최근 일부 개발자들로부터 자사 비공개 LLM인 '미디엄 3(Medium 3)'를 두고 신뢰 훼손 논란에 휩싸였던 미스트랄은, 새로운 오픈소스 모델 ‘데브스트랄(Devstral)’을 공개하며 기술적 반전을 꾀하고 있다.
이번에 발표된 데브스트랄은 공동 개발사인 올 핸즈 AI(All Hands AI)와 함께 제작한 새로운 코드 특화 오픈소스 언어 모델이다. 모델 크기는 24억 파라미터로, 업계 표준 대비 훨씬 작은 수준이다. 덕분에 맥북이나 일반 노트북에서도 구동할 수 있을 만큼 연산 부담이 낮다. 하지만 성능만큼은 결코 가볍지 않다. 실제로 깃허브 기반 SWE-Bench Verified 벤치마크에서는 46.8%의 정확도를 기록하며 오픈모델 중 최고 성능을 입증했다. 이는 GPT-4.1 미니 모델을 20%포인트 이상 웃도는 결과다.
무엇보다 데브스트랄은 단순한 코드 생성이 아닌, 파일 간 맥락을 이해하고 대규모 코드베이스를 분석하는 등 *소프트웨어 엔지니어링 전체 과정을 수행하는 에이전트형 AI*라는 점에서 차별화된다. 미스트랄은 이러한 모델 특성이 새로운 개발 에이전트 프레임워크들과의 연계를 통해 진가를 발휘할 것이라고 강조한다. 실제로 데브스트랄은 오픈데빈(OpenDevin), SWE-에이전트, 오픈핸즈(OpenHands) 등 코드 에이전트 플랫폼들과 긴밀하게 통합되어, 테스트 자동화, 코드 수정, 다단계 태스크 실행 등에 즉시 활용할 수 있게 설계됐다.
고성능에도 불구하고 데브스트랄은 아파치 2.0 라이선스로 공개돼, 누구나 자유롭게 배포·수정이 가능하다. 상업적 활용 역시 제약이 없다. 미스트랄의 연구원 바티스트 로지에르(Baptiste Rozière)는 “인터넷 연결 없이도 비행기에서 쓸 수 있는, 진정한 로컬 개발자 도구를 지향했다”며 오픈 철학을 재차 강조했다.
이번 모델은 미스트랄이 지난해 공개한 프로그램 특화 LLM 시리즈 '코드스트랄(Codestral)'의 연장선상에 있다. 코드스트랄은 최대 220억 파라미터로 80개 이상 언어를 지원하며, 코드 자동완성 영역에서 두각을 나타냈다. 이후 출시된 코드스트랄-맘바, 코드스트랄 25.01은 IDE 플러그인 및 기업 고객용으로 인기를 끌었다. 데브스트랄은 여기에 ‘에이전트화’를 더한 진화형으로 평가된다.
현재 데브스트랄은 미스트랄 플랫폼 API를 통해 이용 가능하며, 입력 100만 토큰당 $0.10(약 144원), 출력은 $0.30(약 432원)이다. 또한 오라마(Ollama), 허깅페이스(Hugging Face), 앱 스튜디오, 언슬로스 등 주요 오픈소스 플랫폼을 통해 자유롭게 배포된다. 지원 프레임워크는 vLLM, 트랜스포머, 미스트랄 인퍼런스 등이다.
미스트랄 측은 데브스트랄에 사용한 RLHF(강화 학습 기반 미세조정)와 안전성 강화 기법이 성능 향상의 핵심이라고 설명했다. 또한 특정 벤치마크만을 타깃으로 하지 않고 다양한 리포지터리와 실제 프로젝트 환경을 기반으로 훈련 및 검증해 범용성도 확보했다고 밝혔다.
미스트랄과 올 핸즈 AI는 이번 공개 이후 향후 더 대형 모델의 개발 계획도 예고했다. 로지에르는 “작은 모델과 큰 모델 간의 차이는 존재하겠지만, 그 간극을 좁혀가는 데 상당한 진전을 이뤘다”며 “데브스트랄은 단순한 코드 생성 AI가 아니라, 자율형 소프트웨어 엔지니어링 시대의 기반이 될 것”이라고 자신감을 보였다.