코히어, 추론 특화 AI '커맨드 A 리즈닝' 공개…기업 맞춤형 활용 본격화

| 김민준 기자

캐나다 기반 생성형 AI 스타트업 코히어(Cohere)가 첫 추론 특화 대형 언어 모델 ‘커맨드 A 리즈닝(Command R Reasoning)’을 공개하며 기업 시장 공략에 시동을 걸었다. 최근 수억 달러 규모의 자금 유치에 성공하며 기업 가치 68억 달러(약 9조 7,900억 원)를 인정받은 코히어는 해당 모델을 통해 대규모 서류 처리, 이메일 응대, 데이터 분석 등 복잡하고 반복적인 업무를 자동화하려는 글로벌 기업들의 수요에 대응할 방침이다.

이번에 발표된 커맨드 A 리즈닝은 오직 텍스트 기반이지만 다른 멀티모달 시스템과 쉽게 연동될 수 있도록 설계됐다. 특히 API 호출, 외부 데이터베이스 연결 등 다양한 툴 사용 능력이 내장돼 있는 것이 강점이다. 코히어는 이를 통해 고객 서비스, 시장 조사, 일정 조율, 문서 분류와 같은 반복 업무를 모듈화하고, 안전하면서도 정확한 추론 기능을 기업이 자체 인프라에서 사용할 수 있도록 한다는 전략이다.

모델은 최신 멀티 GPU 환경에서 최대 25만 6,000개 토큰을 처리할 수 있으며, 230억에서 1110억 개에 이르는 파라미터 규모를 자랑한다. 영어, 프랑스어, 스페인어, 일본어, 아랍어, 힌디어를 포함한 총 23개 언어를 기본으로 지원해 글로벌 기업들의 언어 장벽을 낮췄다. 특히 새로운 AI 관리 플랫폼 ‘노스(North)’에 통합돼 기업이 자체 서버 환경에서도 완전한 제어 하에 AI 에이전트를 배포할 수 있도록 한다.

이 모델은 단순 성능을 넘어서 ‘예산 기반 추론(token budget reasoning)’ 기능을 통해, 입력마다 사용할 추론 자원을 세밀하게 조절할 수 있도록 했다. 낮은 추론 예산을 지정하면 빠르고 저렴한 결과를, 높은 예산을 설정하면 더 깊고 정교한 해석을 얻을 수 있다. 개발자는 필요에 따라 추론 모드를 자유롭게 켜거나 끌 수 있어, 하나의 모델로 다양한 수준의 분석을 수행할 수 있다.

벤치마크 시험에서도 강력한 성능을 입증했다. 커맨드 A 리즈닝은 AI 모델 성능 비교에서 구글(Gemini), 오픈AI, xAI의 그록(Grok) 등 경쟁사를 앞서는 결과를 기록하며, 명확하고 종합적인 문서화 능력을 중시하는 기업 시장에서 우위를 점했다. 대규모 지식 단위 응답, 복잡한 지시사항 이행, 통찰 제공 측면에서도 뛰어난 평가를 받았다.

안전성 측면 역시 눈에 띈다. 코히어는 이번 모델을 민감한 분야에서 사용할 수 있도록 설계하며 과도한 거절(Over-refusal)과 악의적 콘텐츠 생성 간 균형을 맞췄다. 아동 보호, 자기 해, 혐오 표현, 불건전 콘텐츠, 음모론 등 주요 고위험 군을 중심으로 평가가 이뤄졌으며, 실무에 투입 가능한 안정성을 확보했다고 밝혔다.

글로벌 기업 SAP는 이 모델 도입을 결정한 첫 대형 고객 중 하나다. SAP의 AI 총괄 월터 선(Walter Sun) 부사장은 “커맨드 A 리즈닝은 기업별 요구에 맞춤화된 에이전트형 AI 애플리케이션 구축에 도움이 될 것”이라면서 기대감을 드러냈다.

커맨드 A 리즈닝은 현재 코히어 플랫폼을 통해 상용 버전이 제공되며, 연구 목적으로는 허깅페이스(Hugging Face)를 통해 무료 이용이 가능하다. 상업적 사용을 원할 경우에는 코히어와의 별도 계약을 통해 맞춤형 배포가 이뤄진다. 모델은 CC-BY-NC 라이선스 하에서 제공되며, 사용자 정보 제공 및 사용 정책 동의가 요구된다.

기업 입장에서는 다양한 배포 방식, 고성능 추론 성능, 정량화 가능한 자원 조절, 다국어 지원, 안전 설계 등을 모두 갖춘 단일 모델이라는 점에서 매력적이다. 코히어는 커맨드 A 리즈닝을 통해 기업용 생성형 AI 시장에서 독자적인 입지를 확보하겠다는 포부를 드러냈다.