그래프 데이터베이스 전문기업 네오포제이(Neo4j)가 오늘 발표한 ‘인피니그래프(Infinigraph)’는 대규모 분산 그래프 기술의 진화를 상징하는 신제품이다. 이 플랫폼은 실시간 트랜잭션 처리와 분석용 워크로드를 하나의 그래프 데이터베이스 구조 안에서 병렬 실행할 수 있도록 설계되었으며, 저장 용량은 100테라바이트 이상 확장 가능한 것이 특징이다. 네오포제이는 과거 단일 머신에서 실행돼야 했던 시스템적 한계를 넘어, 데이터 샤딩(sharding)을 통해 연결 정보를 수십억 개 수준까지 늘리고 수천 개의 동시 쿼리를 감당할 수 있도록 기술 기반을 재정비했다.
이번 발표는 2년 이상에 걸친 내부 개발의 결과물로, 기존 그래프 데이터베이스에서 빈번하게 문제였던 분석 시스템과 운영 시스템의 이원화 문제를 효과적으로 해소한 것이 핵심이다. 일반적으로 대형 조직은 데이터를 ETL 파이프라인으로 옮기거나 서로 다른 데이터베이스를 복합적으로 운용해야 했지만, 인피니그래프를 도입하면 이러한 이중 구조를 단일 플랫폼으로 통합할 수 있다. 특히 ACID(원자성, 일관성, 격리성, 지속성) 속성을 유지하면서도 수평 확장이 가능해, 신뢰성과 처리량 모두를 확보할 수 있다.
회사 측은 인피니그래프를 통해 수천만 개의 문서를 벡터 형태로 그래프에 삽입할 수 있다고 강조했다. 문서 검색 외에도 각종 사기 탐지, 컴플라이언스 모니터링, 제품 지식 그래프 구축 등 고도화된 데이터 활용 분야에서 활용될 수 있다. 수디르 하스베(Sudhir Hasbe) 네오포제이 CTO는 "과거에는 약물개발을 위해 수천만 건의 연구 문서를 따로 보관해야 했지만, 이제는 해당 데이터를 직접 그래프에 통합해 유의미한 분석이 가능해졌다"고 밝혔다.
이번 제품은 네오포제이가 4년 전 공개한 분산 질의 기술 ‘패브릭(Fabric)’을 기반으로 한다. 다만, 과거에는 고객이 직접 데이터 샤딩을 설계해야 했던 반면, 인피니그래프에서는 그 과정을 자동화해 사용자 편의성과 확장성을 동시에 확보했다. 특히, 그래프 특유의 경로 탐색 질의 처리를 위한 전역 인덱스와 연계된 분산 스토리지 구조가 안정적인 성능을 구현하는 데 주효했다는 설명이다.
선도 고객사로는 인튜이트(Intuit), 던앤브래드스트리트(Dun & Bradstreet) 등이 포함됐다. 이들은 실시간 질의와 패턴 분석이 동시에 가능하다는 점에서 새로운 기술의 강점을 높게 평가했다. 하스베 CTO는 “대형 글로벌 은행들이 수백 테라바이트 이상 데이터를 실시간으로 처리해 사기를 탐지하고 있다”며 신기술의 인프라 활용 가능성을 강조했다.
또한 이번 발표는 AI 시대와 맞물려 중요성이 높아진 비정형 데이터 처리에도 무게를 둔다. 생성형 인공지능 특성상 텍스트, 이미지 등 비정형 데이터를 대규모로 포함해야 하는데, 벡터 기반의 그래프 데이터베이스는 이를 효과적으로 소화할 수 있다. 네오포제이는 2023년부터 벡터 기능을 장착했으며, 이제는 웨스팅하우스나 일라스틱서치 같은 별도의 시스템 없이 벡터 정보를 자체적으로 통합 운영할 수 있다는 점에서 아키텍처 단순화 효과가 크다.
현재 인피니그래프는 네오포제이의 엔터프라이즈 에디션에서 얼리 액세스 형식으로 제공되고 있으며, 오는 10월부터는 클라우드 기반 플랫폼인 ‘오라DB(AuraDB)’로도 확장될 예정이다. 요금 체계는 연산과 저장을 분리한 ‘디커플드 모델’을 채택해, 필요에 따라 유연하게 자원을 늘리고 비용을 절감할 수 있도록 설계됐다. 하스베 CTO는 “작은 규모의 워크로드를 가진 고객들은 현재보다 더 낮은 요금을 경험할 가능성이 있다”고 전망했다.