AI 기술이 빠르게 확산되는 가운데, 기업들이 정면으로 맞닥뜨리는 가장 큰 과제 중 하나는 고객 데이터를 안전하게 활용하는 문제다. 특히 금융, 헬스케어, 급여 서비스 등 규제가 엄격한 산업에서는 개인정보 보호, 데이터 주권, 컴플라이언스 등의 이유로 대규모 언어 모델(LLM) 기반의 AI 전략을 실현하기 어려운 상황이다.
이 같은 현실에서 데이터마스크(DataMasque)가 제시한 해법이 업계의 주목을 받고 있다. 이 회사는 아마존웹서비스(AWS)의 인프라를 기반으로, 기업 내부의 폐쇄망 환경에서 작동하는 소위 ‘다크 사이트(dark site)’ 방식의 데이터 마스킹 솔루션을 제공하고 있다. 핵심은 실존 고객 정보와 동일한 구조를 갖춘 ‘합성 데이터'를 생성해 외부 유출 없이 AI를 개발·테스트할 수 있도록 돕는 것이다.
그랜트 드 리우(Grant de Leeuw) 데이터마스크 최고경영자는 최근 뉴욕증권거래소(NYSE)와 실리콘앵글(SiliconANGLE)이 공동 개최한 'AI+클라우드 리더스 미디어 위크' 행사에서 “민감 데이터를 외부로 보내지 않고 기업 내 보안 구역 안에서 합성 데이터를 생성·활용할 수 있는 점이 가장 큰 강점”이라고 강조했다.
데이터마스크는 클라우드나 온프레미스 환경 내에 직접 배포되는 구조여서, 일반적인 SaaS형 플랫폼처럼 고객 개인정보가 플랫폼 외부로 유출될 위험이 없다. 드 리우 CEO에 따르면, 이 기술은 필드 단위로 데이터를 마스킹하기 때문에 정보 유출 우려를 최소화할 뿐 아니라, 실제 운영 환경과 유사한 ‘가짜 고객 정보’ 데이터셋을 구성할 수 있다.
이처럼 정교한 합성 데이터는 단순 보안 수단을 넘어 AI의 현실 검증 기능을 향상시키는 역할도 한다. 예컨대, 생년월일 오류나 주소 충돌과 같은 엣지 케이스를 데이터 마스킹 단계에서 미리 포착함으로써, 실제 환경에서의 AI 성능 저하를 미연에 방지할 수 있다는 것이다.
이러한 방식은 특히 AI 에이전트를 실제 고객 서비스에 도입하기 전 단계인 학습 및 테스트 과정에서 데이터 보안을 확보할 수 있다는 점에서 사용성이 크다. 기존 솔루션이 민감 정보를 희생시킨 채 AI 도입을 추진해왔던 반면, 데이터마스크는 개인 정보 보호와 AI 혁신이라는 두 마리 토끼를 동시에 잡고 있는 셈이다.
드 리우 CEO는 “현실적으로 AI 는 규제 장벽과 민감 정보 처리 이슈 없이 구현되기 어렵다”며 “합성 데이터를 통한 개발·검증 프로세스는 기업들이 AI를 안전하고 정상적으로 도입하는 중요한 밑그림이 될 것”이라고 내다봤다.
AI 산업의 핵심 화두가 ‘속도’에서 ‘안전성’으로 옮겨가는 시점에, 데이터마스크의 솔루션은 기업에 보다 실용적이고 전략적인 선택지를 제공하고 있다. 이는 규제 산업군뿐 아니라 점점 더 까다로워지는 데이터 보호 요구에 직면한 모든 조직에 의미 있는 시사점을 던진다.