비정형 데이터에 숨겨진 가치를 실현하고자 하는 기업들의 움직임이 빠르게 본격화되고 있다. 그동안 문서, 계약서, 이미지 등 다양한 콘텐츠는 시스템 곳곳에 파편화되어 단순 보관에 그쳤지만, 최근 생성형 AI와 고도화된 데이터 파이프라인 기술이 결합되면서 이제 이들 데이터가 기업의 *의사결정 자산*으로 재탄생하고 있다.
박스(Box)의 최고기술책임자 벤 쿠스는 "생성형 AI는 태생적으로 비정형 데이터를 기반으로 설계됐다"고 강조하며, "이는 단순한 이해를 넘어 데이터 추출, 질의 응답까지 가능한 도구로 진화하고 있다"고 밝혔다. 이 같은 기술은 기업이 마주하는 복잡한 콘텐츠를 분석 가능한 정보로 전환하고, 이를 기반으로 실시간 인사이트를 도출하는 기반을 마련한다.
이번 2025 스노우플레이크 서밋에서 발표된 ‘오픈플로우(Openflow)’는 이러한 전환을 가속화할 핵심 기술이다. 스노우플레이크(SNOW)의 제품 데이터 엔지니어링 부문 수석 부사장인 크리스 차일드는 오픈플로우를 통해 박스, SaaS 애플리케이션, 온프레미스 데이터베이스 등 다양한 소스에서 비정형과 정형 데이터를 통합해 처리할 수 있다고 설명했다. 이를 통해 과거라면 수작업으로 며칠이 걸리던 데이터 통합과 분석이 실시간으로 가능해졌다.
박스의 고객들은 이미 수백만 건의 계약서를 대상으로 주요 데이터 항목을 추출하고 있다는 점에서, 단순 콘텐츠 저장소에 머물렀던 플랫폼의 역할이 얼마나 변화됐는지를 보여준다. 벤 쿠스는 “고객들은 누가 서명했고, 유효 기간이 언제까지이며, 주요 조건은 무엇인지 알고 싶어한다”며, “오픈플로우는 바로 이런 요구에 대한 해답”이라고 말했다.
한편, 데이터 활용에서 보안과 거버넌스 이슈도 빠질 수 없다. 기업들이 민감한 정보를 AI 기반 시스템과 연계하는 만큼, 데이터통제권과 개방형 아키텍처의 중요성이 더욱 부각되고 있다. 쿠스는 “AI를 조직 전반에 도입하려면 플랫폼 자체가 데이터 유출을 원천 차단할 수 있고, 다양한 시스템 간 자유로운 연결을 보장해야 한다”고 말했다. 특히 하나의 벤더에 종속되는 구조는 피해야 한다는 점이 강조됐다.
이처럼 스노우플레이크와 박스는 비정형 데이터를 기업 전략 중심에 놓고, 이를 기반으로 미래형 AI 시스템을 구성하는 데 박차를 가하고 있다. 기업 입장에서 이제 가장 중요한 것은 데이터를 많이 모으는 것이 아니라, *의미 있게 활용할 수 있는 체계*를 얼마나 빠르게 구축하느냐다. 이러한 흐름 속에서 오픈플로우와 생성형 AI는 단순한 기술 혁신을 넘어 *비즈니스 운영 방식을 뒤흔드는 전환점*으로 작용하고 있다.