중국 AI 스타트업 Z.ai가 강력한 오픈소스 언어모델 GLM-4.5 시리즈를 공개하며 글로벌 LLM 시장에 새로운 파장을 예고했다. GLM-4.5와 경량형 버전 GLM-4.5-Air는 추론 능력, 에이전트 실행, 코딩 성능에서 미국산 독점 모델과 대등하거나 그 이상을 보여주며, 고성능 오픈소스 모델에 대한 수요를 자극하고 있다.
Z.ai는 자사 블로그를 통해 GLM-4.5가 Claude 4 Sonnet, Claude 4 Opus, 구글의 Gemini 2.5 Pro 등과 경쟁 가능한 수준이라고 밝혔으며, 실제로 BenchComp, AIME24, SWE-bench Verified 등 주요 벤치마크에서 상위 3위권 성적을 기록했다. 특히 BrowseComp에서는 26.4% 정확도를 기록해 Claude 4 Opus(18.8%)를 앞섰고, MATH 500(98.2%), AIME24(91%), GPQA(79.1%) 등에서 강력한 추론 성능을 보였다.
GLM-4.5 시리즈는 두 가지 작동 모드(깊은 사고 모드와 즉답 모드)를 제공하며, 프롬프트 하나로 전체 슬라이드를 자동 생성할 수 있어 회의, 교육, 리포트 작성 등에서 실용적이라는 평가를 받고 있다. 또한 창의적 글쓰기, 감정 인식 카피라이팅, 브랜드 콘텐츠 제작, 가상 캐릭터 개발, 고객지원 에이전트 등 다양한 용도에 활용 가능하다. GLM-4.5-Air는 성능은 유지하면서도 추론 속도가 빠르고 자원 소모가 적어 비용 민감한 팀에 적합하다.
특히 이번 모델 시리즈는 아파치 2.0 라이선스를 채택해 기업들이 자유롭게 모델을 수정·배포하고 상업적으로 이용할 수 있다. Z.ai가 제공하는 클라우드 API 기준 가격은 GLM-4.5가 100만 토큰당 입력 $0.60(약 860원), 출력 $2.20(약 3,170원), GLM-4.5-Air는 각각 $0.20(약 290원), $1.10(약 1,580원)으로, 주요 경쟁 모델 대비 저렴한 사용료가 강점이다.
아키텍처 측면에서는 MoE(Mixture-of-Experts) 구조를 채택해 자원 효율성과 성능의 균형을 꾀했다. GLM-4.5는 총 3550억, 활성 320억 파라미터로 구성되며, 경량형 Air 모델은 총 1060억, 활성 120억 파라미터로 설계됐다. 미드트레이닝 단계에서는 약 1조 1,000억 개의 코드 및 오픈 데이터가 사용됐고, RL 기반 후처리 단계는 자체 인프라 ‘슬라임(Slime)’으로 처리되며, 학습 효율을 극대화하는 점이 특징이다.
Z.ai는 2019년 설립 당시 Zhipu라는 이름으로 출발해 현재 중국 AI 시장의 대표주자로 성장했다. 알리바바, 텐센트, 치밍벤처파트너스 등으로부터 15억 달러(약 2조 2,000억 원) 이상을 조달했으며 상하이와 청두에서 지방 정부의 투자를 유치했다. 현재는 미국 정부의 엔티티 리스트에 포함된 상태로, 해외 진출에는 제약이 따를 수 있다. 특히 API 사용 시 중국 정부의 콘텐츠 규제에 대비할 필요가 있다는 경고도 있다.
이번 모델 출시는 최근 중국 내 오픈소스 대형 언어모델 출시 붐 속에서 이뤄졌다. 알리바바도 최근 일주일 사이 4개의 LLM을 공개하며, OpenAI 및 구글과의 추론력 경쟁에서 우위를 선점하려는 전략을 취하고 있다. 반면 미국 업계는 메타와 오픈AI가 각각 Llama 4 및 오픈소스 모델 출시를 연기하면서 일정 차질을 겪고 있다.
기업 고객 입장에서는 GLM-4.5 시리즈가 뛰어난 성능과 합리적인 가격, 유연한 배포 옵션을 제공함으로써 대형 독점 모델의 감춰진 대안으로 떠오르고 있다. 특히 AI 파이프라인 구축, 코드 자동화, 멀티에이전트 시스템 통합 등 실무 적용을 고려하는 엔지니어에게는 오픈 구조의 이점이 크다. OpenAI 스타일 인터페이스 호환은 물론 JSON 출력, 콘텍스트 캐싱, 스트리밍 출력 기능까지 지원해 기업 시스템과의 연동도 용이하다.
Z.ai의 GLM-4.5는 더 이상 중국 내 신생기업의 실험적 시도가 아니다. 이는 오픈소스 모델이 상업적으로도, 기술적으로도 미국산 독점 LLM에 맞설 수 있다는 신호탄이며, 엔터프라이즈 기술 의사결정권자들에게 새로운 고려 지점을 제공하고 있다.