AI 성공, 결국 '데이터 아키텍처'에 달렸다… 기업 생존 가를 핵심 열쇠

| 김민준 기자

기업들이 인공지능(AI)의 확장을 본격화하면서, 기반 데이터 아키텍처의 중요성이 그 어느 때보다 강조되고 있다. 데이터가 분산되고 거버넌스가 불확실한 상황에서 AI 도입의 성패는 결국 내부 데이터를 얼마나 신뢰하고 활용할 수 있느냐에 달려 있다는 인식이 확산되고 있다.

IBM의 아메리카 지역 데이터 및 AI 부문 부사장인 마르셀라 바이로는 최근 클라우데라 EVOLVE25 행사에서 진행된 인터뷰에서 “AI에는 데이터가 필수이며, 구조화된 데이터뿐 아니라 비정형 데이터까지 포함한 데이터 아키텍처 전반의 준비가 핵심”이라고 말했다. 그는 “고객들에게 가장 적절한 AI 활용 사례를 식별하고, 투자 대비 효과를 분석하는 동시에 AI가 실제 업무 프로세스를 변화시킬 수 있도록 지원하는 것이 과제”라고 강조했다.

특히 하이브리드 및 멀티클라우드 환경이 이제는 표준이 되면서, 데이터는 온프레미스와 다양한 클라우드에 걸쳐 퍼져 있는 구조다. 이로 인해 기업들은 보다 유연한 프레임워크를 필요로 하고 있으며, 고유 데이터의 통합 관리가 AI 모델의 차별성을 만들어내는 열쇠가 되고 있다.

바이로에 따르면, 기업이 보유한 데이터 중 90% 이상이 비정형 데이터이며, 이 데이터는 구조화된 데이터보다 3배 빠르게 증가하고 있다. 문제는 이 막대한 양의 비정형 데이터가 AI 학습에 거의 활용되고 있지 않다는 것이다. 그는 "AI 애플리케이션과 에이전트를 진정한 차별화 수단으로 만들기 위해서는 비정형 데이터를 효과적으로 통합하고 관리할 수 있는 데이터 아키텍처가 반드시 필요하다"고 지적했다.

데이터 품질과 신뢰도, 그리고 이를 둘러싼 거버넌스 문제는 이제 더 이상 IT 부서만의 고민이 아니다. 사업 부문 전반에서도 데이터에 대한 신뢰와 정합성이 확보되지 않으면 AI의 확장 운영 자체가 불가능하다는 현실을 인식하게 됐다. 이에 따라 데이터 전략이 경영 전략으로 부각되고 있으며, 단순히 외부 AI 모델을 도입하는 것을 넘어 자체 데이터를 활용한 차별화된 AI 구축이 기업 경쟁력의 핵심으로 자리잡는 흐름이다.

AI가 단순 실험 단계를 지나 생산환경으로 들어서는 시점에서, 데이터 아키텍처의 선택은 기업의 AI 생존력을 좌우하는 결정적 요인이 되고 있다. 머신 러닝과 생성형 AI 도입에 앞서 어떤 데이터를 어떻게 준비하고 통제할 것인가에 대한 전략적 접근이 절실한 시점이다.