구글(GOOGL)이 자사의 차세대 인공지능 모델 ‘제미니 3’를 전격 공개하며, 경쟁사 마이크로소프트(MSFT)에 대한 응수에 나섰다. 올해 들어 가장 주목받아온 AI 모델 중 하나였던 제미니 3는 출시와 동시에 다수의 주요 벤치마크 테스트에서 선두를 차지하면서 업계 지형을 다시 짜고 있다.
구글은 제미니 모델 중 가장 똑똑한 이 버전이 새로운 개념을 빠르게 학습하고, 고차원적 추론 역량을 갖췄다고 자신감을 내비쳤다. 제미니 3는 출시 즉시 구글 검색, AI 스튜디오, Vertex AI, 그리고 신형 개발 플랫폼인 ‘안티그래비티(Google Antigravity)’를 통해 광범위하게 배포된다.
데미스 하사비스 구글 딥마인드 CEO는 “제미니 3는 멀티모달 이해에서 업계 최고 수준이며, 역대급의 바이브 코딩 능력을 갖춘 AI”라고 평가했다. 실제로 제미니 3는 LMArena 리더보드에서 1,501점이라는 사상 최고 점수를 기록했으며, GPQA 다이아몬드 테스트에서는 91.9%, 수학 테스트에서는 23.4%의 신규 최고 성과를 달성했다. 하사비스는 “지난 모델인 제미니 2.5 대비 모든 항목에서 월등한 향상을 이뤘다”고 강조했다.
사용자 경험도 진화했다. 제미니 3는 문답형 상호작용에서 ‘판에 박힌 칭찬’ 대신 깊이 있는 통찰을 제안하며, 요청 시 ‘딥 씽크(Deep Think)’ 모드를 활성화해 보다 복잡한 문제에 대해 심층적으로 사고한 뒤 답변하는 기능도 제공한다. 개인 맞춤형 학습 도우미 역할도 가능하다. 다양한 언어로 작성된 손글씨 요리 레시피를 디지털 가족 요리책으로 재구성하거나, 학술 자료와 영상 콘텐츠 등을 기반으로 인터랙티브한 학습 경험을 만드는 것도 가능하다.
개발자를 위한 기술적 진보 역시 두드러진다. 제미니 3는 레퍼런스로 제시된 ELO에서는 1,487점, 터미널 인터페이스 테스트인 Terminal-Bench 2.0에서는 54.2%의 성공률을 기록해 현재로선 가장 뛰어난 바이브 코딩 모델로 평가된다. 개발자들은 AI 스튜디오와 Vertex AI 외에도 커서(Cursor), 깃허브(GitHub), 제트브레인스(JetBrains), 레플릿(Replit)을 통해도 이 모델에 접근할 수 있다. 특히 안티그래비티 플랫폼은 AI가 자체적으로 코드를 작성하고 실행하는 능력을 부여함으로써 생산성의 새로운 기준을 제시한다. 단순 보조를 넘어 자율적 문제 해결자로 자리매김하고 있는 것이다.
보안 측면에서도 구글은 철저함을 강조했다. 제미니 3는 자사 ‘프론티어 안전기준 프레임워크’와 외부 기관들이 수행한 다층적 평가 과정을 거쳐, 입력 유도 공격 및 악성 코드 저항력에서 향상된 내성을 입증했다. 향후 일부 기능은 구글 AI 울트라 구독자에게부터 순차적으로 제공될 예정이다.
제미니 3의 등장으로 생성형 AI 시장은 다시 한 번 빠르게 재편되고 있다. 구글은 단순히 대규모 언어모델 경쟁을 넘어서, 멀티모달 통합 처리, 코딩 자동화, 맞춤형 인터페이스, 그리고 보안 강화를 모두 아우르는 차세대 인공지능 생태계 구축을 현실로 끌어오고 있다.




