브루클린에 본사를 둔 스타트업 스트럭티파이(Structify)가 '데이터 준비의 병목현상'이라는 오랜 AI 문제에 도전장을 내밀며 공식 출범과 함께 410만 달러(약 59억 원) 규모의 시드 투자를 유치했다. 이번 투자는 베인 캐피털 벤처스가 주도했고, 8VC, 인테그랄 벤처스, 전략적 엔젤 투자자들도 참여했다.
스트럭티파이는 독자적으로 개발한 비주얼 언어 모델 ‘DoRa’를 통해 웹 데이터를 자동 수집·정제하고, 기업용 데이터로 구조화하는 플랫폼을 선보였다. 데이터 과학자들이 업무 시간의 80% 이상을 데이터 준비에 투입한다는 현실을 감안하면, 해당 솔루션은 산업 전반에 걸쳐 큰 효율성과 생산성 향상을 기대할 수 있다.
플랫폼 사용자는 직접 데이터 스키마를 정의하고, 원하는 데이터 출처를 선택해 DoRa 에이전트를 배치함으로써 맞춤형 데이터세트를 생성할 수 있다. 이 도구는 미국 증권거래위원회(SEC) 보고서와 링크드인 프로필, 산업 전문 문건까지 폭넓게 대응이 가능하다. 공동창업자 로낙 간디는 “DoRa는 마치 사람처럼 웹을 탐색하고 상호작용한다”며 “품질 면에서 인간 수준의 정밀도를 구현했다”고 자부했다.
스트럭티파이가 주목받는 이유 중 하나는 데이터 정확도 확보를 위한 ‘4단계 검증 시스템’이다. AI가 수집해온 데이터 중 의심스러운 항목은 해당 분야 전문가가 직접 검토해 적합성을 확인하며, 이 피드백은 기계 학습에 활용되어 모델의 성능을 지속적으로 향상시킨다. 이러한 접근은 제약, 건설 등 고도 전문 영역에서 특히 강점을 발휘한다.
이미 금융, 건설, 세일즈 등 다양한 업계에서 스트럭티파이의 활용이 진행 중이며, PDF 파일 등 처리 난이도가 높은 비정형 데이터에 대해서도 신속하게 정보 추출이 가능한 것이 특징이다. 베인 캐피털 벤처스의 슬레이터 스티치는 “모든 기업이 다루기를 꺼려하는 복잡한 데이터원이 존재한다"며 "스트럭티파이는 여기에 해답을 제시하고 있다”고 평가했다.
사용자 프라이버시에 대한 고려도 철저하다. 비로그인 영역에서만 데이터를 탐색하며, 직접 확인 가능한 출처 링크를 제공해 ‘블랙박스’ 방식의 기존 데이터 업체들과 차별화된 투명성을 확보했다는 게 회사 측 설명이다.
창업자들의 문제의식 또한 스트럭티파이 개발의 출발점이 됐다. 간디는 데이터 분석가 시절, "매번 데이터를 손으로 모으고 정제하는 일이 너무 비효율적이었다"며, “아이디어에서 데이터세트 도출까지 실시간 실행력이 절실했다”고 회고했다. 공동창업자 알렉스 라이헨바흐 역시 투자은행 경력 중 데이터 품질 문제로 반복적인 분석 실패를 겪은 경험이 기반이 됐다.
향후 스트럭티파이는 이번 투자를 바탕으로 기술 인력을 확충하고, 산업별 맞춤형 기능을 강화해 ‘범용 데이터 툴’로 자리매김하겠다는 전략이다. 이를 위해 무료 버전부터 온프레미스 배포가 가능한 엔터프라이즈 옵션까지 다양한 상품군을 마련해 접근성을 높이고 있다.
산업 전반에서 생성형 AI 도입이 가속화되며, 기반 데이터를 얼마나 신뢰성 있게 확보하느냐가 핵심 경쟁력으로 부상하고 있다. MIT 테크놀로지 리뷰에 따르면, 기업의 80% 이상이 여전히 데이터 기반이 취약해 AI 효과를 온전히 누리지 못하는 것으로 나타났다.
스트럭티파이의 간디는 “이제 데이터셋 생성이 반복 가능한 프로세스가 되어야 한다”며 “우리가 제시하는 해법은 기업이 진정한 데이터 중심으로 진화할 수 있는 기반을 마련해준다”고 강조했다.