AI 기반 데이터 접근 플랫폼 개발사 스타버스트 데이터(Starburst Data)가 기업의 인공지능 도입 장벽을 낮추기 위한 대대적인 플랫폼 업그레이드를 단행했다. 이번 발표는 멀티클라우드, 온프레미스, 하이브리드 등 데이터가 분산돼 있는 환경에서도 AI 모델을 손쉽게 구축할 수 있도록 지원하는 데 초점을 맞추고 있다.
스타버스트는 오픈소스 트리노(Trino) 기반 분산 SQL 엔진을 활용해 불필요한 데이터 이동 없이 위치 기반 분석이 가능한 ‘레이크사이드(lakeside)’ 아키텍처를 중심으로 엔터프라이즈 고객을 겨냥한 기능을 확장해 왔다. 특히 이번 업데이트는 민감한 기업 데이터를 외부로 복사하지 않고도 AI 모델 개발과 적용이 가능하도록 여러 기능을 추가한 것이 특징이다.
새롭게 공개된 ‘스타버스트 AI 워크플로우’는 비정형 데이터를 벡터 임베딩(Vector Embedding) 방식으로 전환해 자연어 기반의 AI 엔진이 해당 데이터를 이해할 수 있게 해준다. 기존에는 이메일, 문서, 로그 등 다양한 소스 데이터를 분석할 때 외부 파이프라인 구축이 필수였지만, 이번 기능을 사용하면 별도 도구 없이 플랫폼 내에서 처리가 가능하다.
또한 내장된 ‘AI 에이전트’를 통해 사용자는 자연어로 질문을 던지고, 플랫폼은 이를 SQL 질의로 자동 변환해 분석을 수행한다. 스타버스트 측은 해당 기술이 단순히 LLM을 감싼 래퍼 수준을 넘어 사용자의 의도를 맥락적으로 파악하고, 그에 맞춰 결과를 도출할 수 있도록 설계됐다고 밝혔다. 특히 공공, 금융, 의료 등 고도의 보안 요건이 필요한 산업 환경에서도 사용할 수 있도록 보안성도 강화했다.
기업 내 데이터 거버넌스를 단순화하는 기능도 강화됐다. 이번에 추가된 자동 태깅 기능은 개인정보나 민감 데이터가 포함된 열을 자동으로 식별하고 라벨링해, 접근 정책을 보다 정교하게 적용할 수 있도록 지원한다. 더불어 기존 하이브(Hive) 메타스토어를 대체하는 차세대 데이터 카탈로그도 도입됐다. 이 카탈로그는 빠르게 업계 표준으로 자리잡고 있는 아이스버그(Iceberg) 포맷과 긴밀하게 연계된다.
쿼리 성능을 높이고 분석 효율성을 개선하기 위한 업데이트도 이뤄졌다. 대표적으로 파워 BI, 태블로 등 BI 도구와의 연동 속도를 높이기 위한 ODBC 드라이버가 추가됐으며, 사용자 역할 기반의 쿼리 라우팅과 고가용성을 위한 분산 쿼리 처리 기능도 도입됐다.
이와 함께 스타버스트는 최근 시티그룹(Citigroup)으로부터 전략적 투자를 유치했다고 밝혔다. 시티는 165개국에 걸친 데이터 접근 일원화를 위해 스타버스트 솔루션을 활용하고 있으며, 이번 투자로 인해 스타버스트는 규제 산업에서의 신뢰도 확보에도 박차를 가할 계획이다.
이번 기능 강화는 AI를 단순 기능이 아닌 기업 전반의 데이터 아키텍처에 통합하려는 흐름에서 비롯됐다. 데이터가 흩어져 있고, 보안 요건이 까다로운 기업일수록 기존 방식으로는 AI 추진이 쉽지 않다. 스타버스트는 하이브리드 데이터를 한 곳으로 모으지 않아도 AI가 가능한 구조를 제시하며, AI 도입에 따른 *데이터 병목 현상*을 해소하는데 집중하고 있다.
스타버스트는 앞으로도 규제 환경 적합성을 높이기 위한 기술 투자와 함께, 여러 에이전트 간 협업을 가능하게 하는 프로토콜 통합 등 AI 생태계 연결성 강화에도 주력할 계획이라고 밝혔다.