구글이 고속·저비용 지능형 모델 '제미니 3 플래시(Gemini 3 Flash)'를 출시하고, 이를 API 및 Vertex AI에 연동할 수 있도록 개방했다고 PANews가 12월 18일 보도했다. 구글은 이 모델이 GPQA Diamond 테스트에서 90.4%, Humanity's Last Exam(툴리스)에서 33.7%의 성능을 기록했다고 밝혔다. 기존 모델인 '2.5 Pro'보다 빠르고 저렴하며, 낮은 수준의 사고 단계에서는 더 뛰어난 성능을 보여준다는 설명이다.
가격은 입력 토큰 100만 개당 0.5달러, 출력 토큰 100만 개당 3달러이며, 오디오 입력의 경우 1달러다. 또한, 컨텍스트 캐싱 기능을 통해 최대 90% 비용 절감이 가능하고, 배치 API를 통해 비용 50% 절감 및 속도 향상도 기대된다.
새로운 기능으로는 향상된 시각·공간 추론 및 코드 실행 능력이 포함돼 이미지 크기 조정, 연산 및 편집이 가능하다. 해당 모델은 Google AI Studio, Antigravity, Gemini CLI, Android Studio, Vertex AI 등에 통합됐다.




