클라우데라, 생성형 AI 대응 전략 공개… “데이터 옆에 모델 둬야”

| 김민준 기자

인공지능 도입이 빠르게 확산되는 가운데, 기업들에게 가장 큰 난제로 떠오른 건 각 기업의 데이터 환경에 적합한 데이터 아키텍처를 설계하는 것이다. 클라우데라(Cloudera)는 이러한 도전에 유연한 접근 방식을 제시하며, AI와 데이터가 동일한 위치에서 동작할 수 있도록 지원하는 전략을 내놓고 있다. 이를 통해 기업이 규제 요건을 충족하면서도 사용자 경험을 해치지 않는 AI 활용이 가능하다는 점을 강조한다.

클라우데라의 최고 AI 아키텍트인 마나시 바르탁(Manasi Vartak)은 최근 개최된 ‘Cloudera Evolve 2025’ 행사에서 “모델은 반드시 데이터가 존재하는 곳에 있어야 한다”고 밝혔다. 유럽의 고객 데이터를 활용한 사기 탐지용 모델은 유럽 내 환경에서 실행되어야 하며, 데이터를 무분별하게 전송하는 방식은 보안과 경험, 두 측면 모두에서 불리하다는 게 그녀의 설명이다. 최근 기업들이 생성형 AI(Gen AI) 활용을 논의하면서 프라이버시와 규제에 대한 우려가 커지고 있는데, 클라우데라는 로컬 인프라와 클라우드, 주권 데이터 환경 전체를 아우르는 통합 플랫폼을 구축 중이다.

바르탁은 이전에 머신러닝 인프라 스타트업 ‘베르타(Verta)’를 창업했으며, 이 회사가 최근 클라우데라에 인수되면서 클라우데라의 AI 전략을 이끄는 핵심 인물로 합류했다. 그녀는 예측형 AI와 생성형 AI를 통합한 접근법을 통해 사기 탐지, 고객 서비스 등 복잡한 문제에 보다 효과적으로 대응할 수 있다고 강조했다. 예를 들어, 생성형 AI를 통해 특징(feature)을 추출하고 이를 예측 알고리즘에 활용하는 방식이 대표 사례다.

앞으로는 인간과 AI가 역할을 분담해 공동 작업하는 '에이전트 워크포스(agent workforce)' 개념도 부상할 것으로 보인다. 바르탁은 이를 실현하기 위한 핵심 과제로 '역할 기반의 접근제어'를 들었다. AI도 사람과 같은 권한 구분이 필요하다는 의미다. 데이터 접근 권한을 모르고 AI 에이전트를 투입하게 되면, 예컨대 요약 전용 에이전트가 재무 정보에 접근하는 우를 범할 수 있다는 우려에서다.

한편, 오픈소스 모델을 선호하는 기업 고객이 늘고 있다는 점도 주목된다. 이는 프라이버시 보호를 핵심 가치로 삼는 고객들이, 외부 플랫폼 대신 자사 환경 내에서 AI를 운용하려는 니즈를 반영한 결과다. 클라우데라는 이를 수용하기 위해 개방형이고 확장 가능한 플랫폼 설계를 고수하고 있으며, 다양한 외부 AI 툴과의 연동성도 확보하고 있다.

생성형 AI의 한계로 자주 지적되는 '환각(hallucination)' 현상은 아직 불가피한 영역이다. 바르탁은 “환각은 이러한 모델의 학습 방식에서 기인한 결과”라며, “이를 완전히 제거하려면 창의성도 떨어질 수 있다”고 진단했다. 오픈AI 등의 시도처럼 훈련법을 개선하거나 검증 체계를 보완하는 등의 대책이 병행되겠지만, 일정 수준의 환각은 분명 생성형 AI의 일부분이자 개성일 수 있다는 것이다.

클라우데라는 앞으로도 AI의 기업 내 도입을 가속화하며, 하이브리드 환경 전반에서 일관된 사용자 경험을 제공하는 데 초점을 맞출 계획이다. AI의 역할이 데이터를 분석하는 단계를 넘어 비즈니스 의사결정까지 확장되는 만큼, 이를 뒷받침할 기술적 기반 마련이 핵심 과제로 부상하고 있다.