일론 머스크(Elon Musk)의 인공지능 기업 xAI가 최신 버전의 대형 언어모델(LLM) 그록 4(Grok 4)를 선보이며 AI 분야에서 새로운 이정표를 세웠다. 이번 모델은 인간 수준의 추론 능력에 초점을 맞춰 설계돼 수학 문제 해결, 코드 생성, 이미지 해석, 차트 분석 등 고차원적 작업 수행에서 압도적 성능을 보였다는 평가다.
그록 4는 지난 수요일(현지시간) 공개됐으며, 발표 직전 머스크가 인수한 소셜네트워크 X의 CEO 린다 야카리노가 돌연 사임하면서, 회사 안팎의 혼란 속에서 주목도가 더욱 높아졌다. 머스크는 지난 3월 X를 약 330억 달러(약 47조 5,000억 원) 전액 주식 거래 방식으로 인수해 xAI와 통합하고, 해당 플랫폼에서 운영 중인 챗봇도 그록 시리즈 모델로 구동해왔다.
이번 그록 4는 지난해 텐서플로우 중심 슈퍼컴퓨터 '콜로서스(Colossus)'에서 훈련됐다. 이 시스템은 2024년 9월 최초 가동 당시 GPU 10만 개를 탑재했으며, 올해 5월에는 20만 개로 확대됐다. xAI는 향후 해당 GPU 수를 100만 개로 늘릴 예정이다.
그록 4는 최대 25만6,000개의 토큰 입력을 처리할 수 있으며, 복잡한 수학·물리 문제와 프로그래밍 과업에 대응할 수 있도록 이과형 사고력에 최적화됐다. xAI는 유명 AI 벤치마크 테스트 ‘휴머니티스 라스트 이그잼(Humanity’s Last Exam)’을 활용해 그록 4의 성능을 검증했으며, 총 2,500개 문제 중 외부 검색 없이 44% 이상을 정답 처리하는 데 성공했다. 이는 오픈AI의 ‘딥 리서치(Deep Research)’가 기록한 26.6%를 크게 웃도는 수치다.
머스크는 직접 “그록 4는 이제 수학이나 물리 시험 문제에서, 질문 자체가 교묘하지 않는 이상 틀리는 일이 없다"고 강조하며, 문제 오류나 모호한 표현까지도 판별하고 스스로 수정한 뒤 모든 해석 버전을 답안으로 제시할 수 있다는 점을 핵심 강점으로 언급했다.
그록 4는 현재 xAI의 API를 통해 개발자들에게 제공되며, 이와는 별도로 여러 AI 에이전트를 병렬 투입해 추가 추론 단계를 거치는 확장판 ‘그록 4 헤비(Grok 4 Heavy)’도 선보일 예정이다. 해당 서비스는 월 300달러(약 43만 2,000원)에 구독 가능한 ‘슈퍼그록 헤비(SuperGrok Heavy)’에 포함된다. 구독자는 이외에도 xAI의 차세대 제품에 우선 접근할 수 있게 된다.
향후 출시 일정도 촘촘하게 짜여 있다. 다음 달에는 개발자 중심의 코드 최적화 모델, 이어 9월에는 멀티모달 기능을 강화한 버전, 그리고 연내 동영상 생성이 가능한 버전을 순차 공개할 계획이다. 장기적으로는 테슬라가 활용하는 과학용 시뮬레이션 소프트웨어와의 통합도 준비 중이며, 대중화 확대를 위해 주요 클라우드 플랫폼에서의 서비스 제공도 추진하고 있는 것으로 알려졌다.
AI 모델의 진화가 정점을 향해 나아가는 가운데, xAI가 내놓은 그록 4는 단순한 언어 이해를 넘어 진정한 추론 중심 AI의 가능성을 현실화한 사례로 부각되고 있다.