구글(GOOGL)이 인공지능(AI) 시스템의 신뢰성과 투명성을 강화하기 위한 새로운 도구인 '데이터 커먼스 MCP 서버(Data Commons MCP Server)'를 공식 출시했다. 이 도구는 공공 데이터 간 연계를 통해 신뢰할 수 있는 통계 정보를 활용할 수 있도록 설계됐으며, AI 시스템이 보다 현실에 기반한 응답을 생성하도록 지원한다.
데이터 커먼스는 구글이 2018년 처음 선보인 공개 지식 저장소로, 경제, 보건, 인구, 환경 등 다양한 분야의 공개 데이터를 그래프로 연결해 통합 데이터베이스 형태로 제공해온 플랫폼이다. 이번 MCP 서버는 이러한 데이터 커먼스를 AI가 직접 조회할 수 있도록 표준화된 인터페이스를 제공한다.
기존에는 AI 개발자가 다양한 API를 다루며 데이터에 접근해야 했지만, MCP 서버는 이를 간소화하며 데이터 기반 응답을 가능하게 한다. 특히 구글은 이 시스템을 활용해 '데이터 중심 에이전트 애플리케이션' 구축 시 필요한 데이터 결합과 접근을 더욱 쉽게 할 수 있다고 강조했다. 현재는 구글의 코드 명령줄 도구인 Gemini CLI와 Agent Development Kit을 통해 통합 개발 환경을 제공하며, 초기 단계에서 사용할 수 있는 샘플 에이전트 및 콜랩 노트북도 함께 공개했다.
예시로 구글은 ONE 캠페인과 협업해 개발한 ‘ONE 데이터 에이전트’를 소개했다. 이 AI 에이전트는 MCP 서버를 통해 글로벌 보건 재정 데이터를 자연어로 질의할 수 있게 구성되어 있다. 사용자는 “어느 국가가 보건 예산에서 취약한가?”와 같은 질문을 던지고, 비교 차트를 생성하거나 원시 데이터를 받아볼 수 있다.
구글의 소프트웨어 엔지니어 케유르 샤(Keyur Shah)는 "기존에는 사용자가 다양한 데이터셋을 넘나들며 수동으로 데이터 수집과 정리를 해야했다"며, "에이전트를 이용하면 복잡한 질의도 이해한 뒤 빠르게 필요한 데이터를 종합할 수 있다"고 설명했다.
이번 출시가 가지는 핵심적 의미는 AI가 생성하는 정보의 정확성 문제를 해결하고자 하는 데 있다. 구글은 대형 언어모델이 사실이 아닌 내용을 생성하는 '환각(hallucination)' 문제를 MCP 서버를 통해 효과적으로 줄일 수 있다고 보고 있다. 모델이 신뢰할 수 있는 통계 데이터를 참조함으로써 결과의 근거를 명확히 밝히고, 정책 입안자나 연구자가 신뢰할 수 있는 응답을 확보할 수 있다는 것이다.
일각에서는 데이터의 신선도, 범위, 정확성, 설명 가능성 등 여전히 풀 문제는 많지만, 이번 MCP 서버 출시는 AI가 실세계를 보다 정확히 반영할 수 있도록 하는 중요한 변화의 시작이라는 평가다. 이를 통해 공공 보건, 기후 변화, 경제 계획 등 현실 세계와의 연결이 중요한 산업에서 '현실 기반 AI'의 도입이 가속화될 가능성이 크다.