MS·AWS·구글 뭉쳤다…‘DocumentDB’, AI 시대 오픈소스 DB 표준 도전

| 김민준 기자

생성형 AI 시대를 맞아 문서형 데이터베이스의 중요성이 커지는 가운데, 마이크로소프트(MSFT), 아마존(AWS), 구글(GOOG)이 리눅스 재단(Linux Foundation) 주도로 열린 새 오픈소스 DB 프로젝트 ‘DocumentDB’에 공동 참여한다. 이들은 이 프로젝트를 통해 데이터베이스 벤더 종속 문제를 해소하고 클라우드 기반 AI 인프라 구축 비용을 절감하는 데 힘을 모으고 있다.

문서형 데이터베이스는 전통적인 관계형 DB와 달리 JSON 기반의 구조로 유연한 데이터 처리를 지원한다. MongoDB처럼 이미 시장을 선점한 상용 솔루션도 존재하지만, 해당 기술은 현재 소스코드가 공개되지 않은 독점 기술로 운영된다. 이에 맞서 마이크로소프트는 2025년 1월 자체 개발한 프로젝트 ‘DocumentDB’를 오픈소스로 공개했고, 이번 주 이 프로젝트는 리눅스 재단으로 이관되어 더욱 광범위한 생태계를 갖추게 됐다. 특히 AWS와 구글까지 가세해 문서형 DB 생태계의 공급업체 중립성을 확보하며 사실상 최초의 벤더 중립 오픈소스 대안이 탄생했다.

마이크로소프트의 개발 총괄 키릴 가브릴류크(Kirill Gavrylyuk) 부사장은 “기존에는 문서형 데이터베이스 시장에 PostgreSQL 같은 개방형 표준이 없었기 때문에, DocumentDB가 실질적인 표준 엔진이 될 수 있다”고 강조했다. 또한 그는 “리눅스 재단과의 협력을 통해 커뮤니티 참여를 확대하고, 프로젝트의 장기적인 지속 가능성을 확보하겠다”고 덧붙였다.

DocumentDB 프로젝트의 핵심은 PostgreSQL 기반 확장성이다. 이 프로젝트는 단순한 새 DB 기술이 아니라 세계에서 가장 널리 쓰이는 오픈소스 관계형 데이터베이스인 PostgreSQL에 BSON(바이너리 JSON)을 지원하는 확장 기능이 통합된 형태로 구성된다. 기존 PostgreSQL의 도구, 백업 솔루션 등 검증된 생태계를 그대로 활용할 수 있으면서도 문서형 쿼리 및 색인 기능까지 갖췄다는 점에서 기업 입장에선 이중의 이점을 누릴 수 있다.

특히 MongoDB 호환을 위해 DocumentDB는 MongoDB 드라이버를 지원하는 게이트웨이를 도입했고, 일부 호환 기능은 아직 개발 중이다. 가브릴류크 부사장은 “MongoDB와의 완전한 호환은 핵심 목표 중 하나이며, 이는 프로젝트 헌장에 명시된 바 있다”고 언급했다. MongoDB와의 호환성이 확보되면 기업은 특정 업체에 종속되지 않으며 오픈소스 생태계 전반에 활용 기회가 열릴 것으로 보인다.

한편 AWS가 운영 중인 상용 데이터베이스 서비스 ‘Amazon DocumentDB’와 이번 리눅스 재단의 오픈소스 프로젝트는 이름은 유사하지만 내부 아키텍처는 완전히 다르다. AWS 제품관리 시니어 매니저 라심 굽타(Rashim Gupta)는 “Amazon DocumentDB는 MongoDB API 호환 솔루션이지만 자체 엔진을 사용한다”며 “리눅스 재단의 DocumentDB는 PostgreSQL 기반의 전혀 별개의 오픈소스 프로젝트”라고 설명했다. 그는 AWS가 두 프로젝트 모두에 투자하고 있으며 기능을 계속 공유할 방침이라고 밝혔다.

AI 워크로드 수요가 폭증하면서 DocumentDB는 더욱 주목받고 있다. 마이크로소프트는 이미 이 프로젝트에 자사 연구소의 벡터 인덱싱 기술 ‘DiskANN’을 통합하고 있으며, 의미 기반 질의 기능도 PostgreSQL을 통해 제공하고 있다. 이를 통해 AI 애플리케이션에서 필요한 데이터 검색, 맥락 유지, 메모리 영역 반영 등에 최적화된 인프라를 확보한 셈이다.

기업 입장에서 DocumentDB는 단지 오픈소스인 것을 넘어, 데이터 일관성과 신뢰성, 그리고 요구되는 AI 기능 지원을 고루 갖춘 전략적 기술로 자리매김할 수 있다. 특히 신규 AI 프로젝트를 설계하는 기업들은 이 기술을 미리 반영할 경우, 폐쇄형 기술로 인한 향후 전환 비용과 종속 리스크를 사전에 차단할 수 있다.

AI 기반 데이터 운영의 미래가 외부 벤더에 대한 의존에서 점차 벗어나고 있는 현시점에서, 이번 DocumentDB 프로젝트는 단순한 기술 공개 그 이상의 함의를 지닌다. PostgreSQL 커뮤니티와 클라우드 기업들의 협업은 이제 문서형 DB까지 확장되며, 오픈소스 데이터베이스 지형도에 새로운 전환점을 가져오고 있다.