인공지능(AI) 기술이 한 단계 진화하며, 단순한 생성 도구를 넘어 개발 전략의 핵심 동력으로 부각되고 있다. 최근 열린 데이터브릭스(Databricks)의 ‘데이터 + AI 서밋 2025(Data + AI Summit 2025)’에서는 이러한 변화를 이끄는 주요 전략과 기술 혁신이 집중 조명됐다.
이번 행사의 핵심 키워드는 ‘에이전틱 AI(agentic AI)’였다. 데이터브릭스는 구체적으로 자연어 기반 코딩 시스템 ‘바이브 코딩(Vibe Coding)’과 실시간 워크플로를 평가·관리하는 ‘에이전트 브릭스(Agent Bricks)’, 그리고 신규 트랜잭션 데이터베이스인 ‘레이크베이스(Lakebase)’를 선보이며 사람과 AI, 데이터 간의 *대화형 접점*을 강화했다. 분석가 존 퓨리어(John Furrier)와 조지 길버트(George Gilbert)는 “머신러닝 파이프라인에 결합 가능한 에이전트가 자율적으로 학습하고 진화하는 플랫폼 구조는 향후 기업 전반의 AI 운영 방식에 근본적인 전환을 가져올 것”이라고 평가했다.
비즈니스 현장의 활용 사례도 다양했다. 버진 애틀랜틱 항공은 바이브 코딩을 통해 비개발자들도 자연어로 AI 기능을 설계·검증할 수 있도록 하고, 서버리스 구조의 레이크베이스와 데이터 관리 도구인 ‘유니티 카탈로그(Unity Catalog)’로 운영 효율성과 투자 대비 효과(ROI)를 실시간으로 추적하고 있다고 설명했다.
데이터브릭스의 AI 확산 전략은 기술기업뿐 아니라 전통 산업에서도 주목받고 있다. 호주의 내셔널 오스트레일리아 은행(NAB)은 26년 된 테라데이터 시스템을 데이터브릭스로 전면 전환하면서 유연한 거버넌스와 재사용 가능한 데이터 인프라를 확보했다. AI 거버넌스 역시 완전한 규제 준수가 아닌 전략적 ‘선택 적용’을 중심으로 재정의되었다는 점에서 업계의 관심을 모았다. 데이터브릭스는 62개 위험 요소와 64개의 통제 기준으로 구성된 리스크 프레임워크를 제시하며 위험과 혁신을 동시에 관리하는 방법론을 공개했다.
SAP와의 협업을 통해서는 오랜 과제였던 SAP 환경 내 비즈니스 데이터의 AI 활용 문제를 해결했다. 미리 준비된 데이터 제품을 통해 복잡한 전처리 없이도 AI 모델을 구축할 수 있고, 데이터브릭스 노트북 환경에서 바로 분석이 가능해졌다. 기업들은 이를 바탕으로 데이터 수명주기를 단순화하고 AI 적용 속도를 높이고 있다.
뿐만 아니라 데이터 파이프라인의 설정과 운영에서도 자동화가 가속되고 있다. 일례로 ‘레이크플로우 커넥트(Lakeflow Connect)’는 코드 없이 다양한 출처의 데이터를 통합하고, 오픈소싱된 파이프라인 모델은 차세대 추출·변환·로드(ETL) 표준으로 자리잡고 있다.
이와 함께 데이터브릭스는 파이브트랜(Fivetran) 등 파트너사와 협력해 기업 내 데이터를 손쉽게 통합, 분석, 실행할 수 있는 생태계를 조성하고 있다. 특히 파이브트랜의 ‘센서스(Census)’ 인수는 AI 분석 결과를 다시 운영 데이터에 반영하는 구조를 구현하며, 데이터 활용의 선순환 체계를 정착시키고 있다.
스타트업 생태계에 대한 투자도 빠르게 확대되고 있다. 데이터브릭스는 자체 벤처 펀드를 통해 40여 개의 초기 단계 AI 기업에 투자를 집행하고 있으며, 교사와 개발자를 위한 1억 달러(약 1,440억 원) 규모의 지원 프로그램도 운영 중이다. 이는 플랫폼 보급을 촉진하는 한편, 분야별 특화 AI 활용을 유도하기 위한 전략으로 해석된다.
가장 주목할 점은 AI가 단순한 도구가 아닌 ‘조음 가능한 시스템’으로 진화하고 있다는 데 있다. 데이터브릭스의 ‘모자이크 AI(Mosaic AI)’는 LLM 기반의 평가 모듈을 통해 AI 에이전트의 결정을 판단하고 학습시키는 구조를 제안하고 있다. 고위험 비즈니스 환경에 실사용 가능한 신뢰성과 확장성을 실현하기 위한 시도다.
이번 서밋은 AI가 점차 개발 중심 단계를 넘어 운영과 전략, 거버넌스의 핵심으로 자리매김하고 있음을 시사한다. 데이터브릭스는 이를 기술적 통합과 파트너십, 생태계 투자까지 다양한 축으로 실현하며 ‘기업 친화적 AI 혁신’의 전방에서 진화를 이끌고 있다.