스노우플레이크, 세일즈포스·블랙록과 손잡고 '공통 데이터 언어' 만든다

| 김민준 기자

스노우플레이크(SNOW)가 주도하는 대형 기술 컨소시엄이 데이터 단일화를 위한 오픈소스 표준 개발에 본격 착수했다. 세일즈포스(CRM), 블랙록, dbt 랩스 등 주요 파트너 17곳이 참여한 이번 이니셔티브는 기업 내 비즈니스 데이터에 대한 의미적 해석을 통합해, 비효율과 중복 정의 문제를 해결한다는 목표다.

‘오픈 시맨틱 인터체인지(Open Semantic Interchange)’라고 명명된 이 움직임은 분석 도구, 데이터 카탈로그, 인공지능 시스템 전반에 걸쳐 공통된 데이터 정의 언어를 도입하자는 취지에서 출발했다. 기업마다 BI 툴이나 분석 시스템에 따라 ‘매출’이나 ‘고객’ 등의 지표가 상이하게 정의돼 온 기존 문제점을 근본적으로 해결하겠다는 선언이다.

스노우플레이크의 분석 제품 관리 책임자인 조시 클라(Josh Klahr)는 “고객 대부분이 벤더 종속 없이 조직 전반에서 호환 가능한 시맨틱 모델을 요구하는 게 분명한 추세”라며 “한 곳에서 만든 정의를 다른 플랫폼에서도 자연스럽게 공유할 수 있는 구조가 필요하다”고 강조했다.

이번 이니셔티브는 초기 단계에서 BI 및 분석 분야에 집중하며, 향후 인공지능 응용 사례로 범위를 넓힐 예정이다. 스펙은 YAML 같은 널리 채택된 형식을 기반으로 작성되며, 개발 완료 시점에는 아파치소프트웨어재단 또는 리눅스재단에 기부하는 방향이 유력하다.

이미 월드와이드웹컨소시엄(W3C) 등에서 분야별 시맨틱 표준이 운영되고 있지만, 이 컨소시엄은 서로 단절된 정의 체계를 하나로 통합하는 데 방점을 찍는다. 특히 AI 시대가 본격화되며 데이터 간 의미 해석 일관성이 핵심 경쟁력으로 부상한 점도 이런 흐름을 가속화하고 있다.

스노우플레이크 측은 이번 표준 초안이 수개월 안에 공개될 것이라고 밝혔으며, 현재도 여러 주요 기술 기업과의 협상을 진행 중인 것으로 알려졌다. 클라는 “다트브릭스(Databricks)가 아직 초기 멤버는 아니지만, 적극적으로 참여하길 기대하고 있다”고 말했다.

데이터 조각화 문제가 조직 내부에서만 아니라 업계 전체의 과제로 떠오른 지금, 스노우플레이크 주도의 이번 연합은 그 해법 중 하나로 주목받고 있다. 벤더 중립성과 오픈소스라는 양대 원칙을 기반으로, 데이터 산업의 새로운 공통 언어를 도입하려는 이 시도에 거는 업계의 기대도 높다.