구글, '제미니 딥 리서치' 대폭 업그레이드…AI 분석 능력 한층 진화

| 김민준 기자

구글(GOOGL)이 자사의 인공지능 에이전트 '제미니 딥 리서치(Gemini Deep Research)'를 대대적으로 업그레이드하며 AI 기반의 정보 검색 및 분석 능력을 한층 강화했다. 이 에이전트는 복잡한 데이터 수집 작업을 자동화하는 데 초점을 맞춘 도구로, 금융 보고서 작성 등 고난도 업무까지 지원한다. 이번에 새로 공개된 버전은 최신 LLM인 '제미니 3 프로(Gemini 3 Pro)'를 기반으로 한다.

기존 제미니 1.5 프로보다 월등한 성능을 자랑하는 제미니 3 프로는 시각적 추론에서 특히 강점을 보인다. 예컨대 창고 로봇의 동선을 계획하거나, 필기체로 작성된 문서와 수학 기호, 차트를 정확히 해석하는 등의 고차원 작업도 소화할 수 있다. 구글은 이 기능을 활용해 문서 분석, 정보 추출, 요약 보고서 생성 등 다양한 업무를 자동화했다고 설명했다.

이번 업그레이드의 핵심은 강화된 웹 검색 성능이다. 구글 딥마인드 담당자들은 블로그를 통해 "제미니 딥 리서치는 정보를 수집할 때 복수의 검색어를 단계적으로 생성하고, 검색 내용 간의 지식 격차를 인식한 뒤 이를 반복적으로 보완하며 학습한다"고 밝혔다. 사실상 단순한 검색 툴이 아닌 복합적 '사고 과정'을 거치는 AI라는 설명이다.

개발자들은 구글이 새롭게 선보인 '인터랙션 API(Interactions API)'를 통해 이 에이전트와 제미니 모델 전반에 접근할 수 있게 됐다. 향후에는 다양한 사전 탑재 에이전트들과 맞춤형 에이전트 개발도 이 API를 통해 가능해질 예정이다. 해당 인터페이스는 복잡한 데이터 관리 절차를 간소화하고 외부 시스템과의 연동까지 지원한다.

성능 측정에서도 눈에 띄는 결과가 나왔다. 구글은 자체 테스트 자료인 HLE와 DeepSearchQA를 통해 제미니 딥 리서치의 역량을 평가했다. 고난이도 수학, 물리, 프로그래밍 문제 2,500개가 포함된 HLE 테스트에서 이 에이전트는 46.4%의 정확도로 정답을 도출했다. DeepSearchQA는 단계별 추론이 필요한 900개의 작업으로 구성된 벤치마크다. 구글은 이 자료를 오픈소스로 공개하며 연구자들이 알고리즘 정확도 개선에 활용할 수 있도록 했다.

또한 DeepSearchQA는 LLM의 '생각 시간'이 검색 정확도에 어떠한 영향을 미치는지를 파악하는 진단도구로 설계됐다. 구글 내부 분석에 따르면, 에이전트가 더 많은 검색과 추론 단계를 실행할수록 성능이 현저히 향상됐다고 전했다.

이번 업그레이드는 단순한 기능 개선을 넘어 AI의 인식과 분석, 추론 역량을 한 단계 진화시킨 사례로 평가된다. 특히 LLM이 실제 데이터 중심 업무에 어떻게 적용되는지를 구체적으로 보여준다는 점에서, 향후 기업 및 연구 현장의 활용도가 높아질 전망이다.