구글(GOOGL)이 기업용 인공지능의 복잡한 정보 탐색 능력을 한 단계 끌어올릴 새로운 AI 프레임워크 ‘테스트 타임 디퓨전 딥 리서처(Test-Time Diffusion Deep Researcher, 이하 TTD-DR)’를 공개했다. TTD-DR은 기존 대화형 챗봇과 다른 흐름을 따르며, 인간처럼 작성, 탐색, 수정의 반복 사이클을 통해 깊이 있는 보고서를 만들어내는 것이 특징이다. 구글 연구진은 이를 통해 퍼플렉시티, 오픈AI, 그리고 그록 등 주요 경쟁사의 시스템을 능가하는 성능을 입증했다고 밝혔다.
TTD-DR의 핵심은 인간의 글쓰기 과정을 모사한 '디퓨전 모델(diffusion model)'과 진화 알고리즘 기반의 '자체 최적화(Self-Evolution)' 기능이다. 초기 초안 단계에서는 상대적으로 '노이즈'가 많은 불완전한 보고서를 먼저 생성하고, 이후 검색 도구를 통해 데이터를 수집하며 점진적으로 정교한 문서로 다듬는 과정을 거친다. 이 접근은 고전적인 검색 기반 생성(RAG)이 처리하기 어려운 경쟁사 분석이나 진입 전략 작성과 같은 고부가가치 업무에서 강점을 드러낸다.
전통적인 리서치 에이전트가 선형 흐름에 기반해 정보를 수집하고 요약하는 반면, TTD-DR은 각 컴포넌트—계획, 질문 생성, 답변 통합—를 개별적으로 최적화하면서 상호작용하는 구조를 갖는다. 구글의 연구 과학자 루쥔 한(Rujun Han)은 이를 ‘보고서 탈노이즈(denoising)의 핵심’이라고 표현하며, “각 모듈이 독립적으로 개선되면 전체 보고서 품질이 비약적으로 향상된다”고 강조했다.
실제 성능 평가에서도 TTD-DR은 압도적이었다. 컨설팅 및 기업 사례를 바탕으로 한 LongForm Research 데이터셋에서는 오픈AI의 딥 리서치 시스템 대비 최대 74.5%의 승률을 기록했다. 복잡한 연역 추론이 요구되는 ‘Humanity’s Last Exam’ 및 GAIA 벤치마크에서도 각각 4.8%, 7.7%, 1.7%의 성능 우위를 보였다. 이러한 결과는 TTD-DR이 단순한 응답 생성 수준을 넘어, 비즈니스 현장에서 활용 가능한 구조화된 문서 작성이 가능함을 보여준다.
이 시스템은 구글의 에이전트 개발 플랫폼인 ADK(Agent Development Kit)를 기반으로 구축됐으며, 코어 언어 모델은 제미니 2.5 프로(Gemini 2.5 Pro)가 사용됐다. 이는 기업이 복잡한 AI 프로세스를 인프라 변경 없이 실험하고 배포할 수 있게 해주는 모듈형 툴킷이다.
TTD-DR의 가능성은 텍스트 생성에 국한되지 않는다. 연구팀은 향후 이 프레임워크를 금융 모델링, 소프트웨어 개발, 마케팅 캠페인 설계 등 다양한 기업 활동에 확장할 계획이다. 루쥔 한은 “프로젝트 초안 작성에서 하나씩 다듬어 완성에 이르는 흐름은 TTD-DR의 작동 방식과 이상적으로 들어맞는다”며 “향후 기업 AI 시스템의 표준이 될 것”이라고 자신감을 내비쳤다.
인공지능의 진화가 단순히 텍스트를 생성하는 단계를 넘어, 고차원적 사고와 문서 설계 능력까지 흡수하고 있는 가운데, 구글의 새로운 시스템은 향후 기업 내 AI 활용 방식에 근본적인 변화를 가져올 가능성이 크다. AI 기반 고급 분석도구의 진화는 아직 초기 단계에 불과하지만, TTD-DR은 이미 그 안착점을 가늠케 하는 의미 있는 이정표가 되고 있다.