AI 데이터셋 강자 톨로카, 1,037억 원 투자 유치…베이조스도 베팅했다

| 김민준 기자

AI 데이터셋 공급업체 톨로카(Toloka)가 1,037억 원 규모의 신규 투자를 유치하며 글로벌 AI 생태계 확장을 본격화하고 있다. 이번 투자 라운드는 아마존 창업자 제프 베이조스가 후원하는 베이조스 익스페디션(Bezos Expeditions)이 주도했고, 쇼피파이(Shopify) 최고기술책임자 미하일 파라킨도 참여했다.

네덜란드에 본사를 둔 톨로카는 나스닥 상장사 네비우스 그룹(Nebius Group NV)의 자회사로, 커스터마이즈된 AI 훈련 데이터를 제공하는 데 특화돼 있다. 이 회사는 20만 명 이상의 어노테이터 및 전문가 네트워크를 활용해 40개 이상의 언어로 머신러닝 학습 데이터를 제작하고 있으며, 엔트로픽(Anthropic), 풀사이드(Poolside) 등 유수의 AI 기업들이 톨로카의 주요 고객사다.

네비우스는 지난해 엔비디아(NVDA), 액셀(Accel) 등으로부터 약 1조 80억 원 규모의 투자를 받았으며, AI 최적화 퍼블릭 클라우드 운영을 중심 사업으로 삼고 있다. 미국 뉴저지주에 300메가와트 규모의 신규 데이터센터 구축을 앞두고 있는 네비우스는 이번 톨로카 투자 이후 해당 기업에 대한 의결권 지분은 줄어들지만, 경제적 이익은 대부분 유지하게 된다.

톨로카는 RLHF(인간 피드백을 통한 강화학습)와 DPO(프롬프트 최적화 직접 파인튜닝)를 모두 지원해 AI 서비스의 사용자 맞춤화를 돕고 있다. 특히 온라인 쇼핑몰, 금융, 소프트웨어 개발 부문 등에서 특정 요구조건을 반영한 데이터셋 제작 수요가 급증하면서, 톨로카의 플랫폼은 희소성과 확장성을 동시에 확보한 AI 인프라로 평가받고 있다.

또한 개발자들이 코드 생성형 AI를 교육할 수 있도록 다양한 프로그래밍 언어 기반의 학습용 코드 예시도 제공하고 있다. 이로써 AI 기반 프로그래밍 보조도구 개발에서도 주요한 역할을 기대할 수 있다. 레드팀 방식 보안검증 테스트를 위한 악의적 프롬프트 데이터 또한 플랫폼 내에서 조달 가능해, 기업들의 AI 모델 품질관리와 안전성 검증 프로세스도 크게 간소화된다.

이번 투자를 통해 톨로카는 전 세계 시장에서 사업을 대대적으로 확장할 계획이다. 회사는 “이번 자금은 플랫폼 확장과 신규 AI 고객사 확보, 글로벌 인재 네트워크 강화에 집중 투입될 것”이라고 밝혔다. AI 기술이 더욱 정교해지는 가운데, 고품질 데이터셋을 안정적이고 신속하게 공급할 수 있는 플랫폼 기업의 중요성이 부각되는 시점이다. 톨로카가 보여준 성장 동력은 향후 AI 생태계의 지속적인 진화를 이끄는 핵심 축이 될 전망이다.