XDOF, ‘피지컬 AI’ 병목인 로봇 학습 데이터 인프라에 베팅

| 손정환 기자

로보틱스 학습 인프라 스타트업 XDOF가 7000만달러, 약 1064억2800만원을 유치하며 본격적으로 시장에 등장했다. 이 회사는 인공지능이 현실 세계에서 안전하게 움직이고 일할 수 있도록 만드는 데 필요한 ‘로봇 학습 데이터’ 부족 문제를 풀겠다는 목표를 내세웠다.

이번 투자에는 스라이브캐피털, 스파크캐피털, 안드리센호로위츠, 럭스캐피털, 원더코 등이 참여했다. 자금 조달과 함께 XDOF는 양손 로봇 조작 분야의 오픈소스 데이터셋 ‘ABC-130K’도 공개했다. 회사 측은 이를 세계 최대 규모의 공개형 양손 로봇 조작 데이터셋이라고 설명했다.

인터넷 데이터로는 부족한 로봇 AI의 현실

XDOF의 등장은 최근 ‘피지컬 AI’에 대한 관심이 다시 커지는 시점과 맞물린다. 오픈AI가 2021년 중단했던 로보틱스 학습 프로그램을 재가동하겠다고 밝힌 지 불과 몇 주 만에 나온 행보다. 텍스트 기반 대규모언어모델은 인터넷에 쌓인 방대한 데이터로 훈련할 수 있지만, 로봇은 실제 물체를 집고 옮기고 조작하는 정교한 행동 데이터가 필요하다는 점에서 상황이 다르다.

문제는 이런 데이터가 사실상 거의 없다는 데 있다. 일부 개발자들은 유튜브 영상이나 공장 현장의 저품질 영상을 활용하려 했지만, 로봇이 요구하는 복잡한 공간 정보와 동작 정밀도를 맞추기에는 한계가 크다. 결국 ‘좋은 모델’보다 먼저 ‘좋은 데이터’를 어떻게 확보하느냐가 핵심 과제로 떠오른 셈이다.

UC버클리 연구에서 출발한 데이터 수집·정제 모델

공동창업자이자 최고경영자인 필리프 우는 테크크런치와의 인터뷰에서 캘리포니아대 버클리 박사과정 시절 직접 이 문제를 겪었다고 말했다. 그는 당시 대규모 로봇 데이터가 없어, 로보틱스용 파운데이션 모델을 어떻게 학습시킬지 논의하기에 앞서 우선 데이터를 모아야 하는 ‘닭이 먼저냐 달걀이 먼저냐’의 상황에 놓였다고 설명했다.

XDOF는 로봇을 움직이는 모델이나 고성능 칩보다도, 로봇이 물리적 상호작용을 배울 수 있게 하는 ‘데이터 피드백 루프’가 더 큰 병목이라고 본다. 이에 따라 회사는 고도로 특화된 데이터 파이프라인, 수집 도구, 주석 시스템을 구축하는 데 집중하고 있다. 단순히 데이터를 파는 것이 아니라 데이터 생성, 정제, 라벨링, 재학습으로 이어지는 인프라 전반을 하나의 사업 영역으로 만든다는 구상이다.

이 회사의 뿌리는 우가 UC버클리 연구진과 함께 진행한 ‘GELLO’ 프로젝트에 있다. GELLO는 사람이 원격으로 로봇 팔을 조종해 정밀한 학습 데이터를 만들 수 있도록 설계된 저비용 원격조작 시스템이다. 이후 우는 최고기술책임자 프레드 셴투, 최고운영책임자 니모 진과 함께 창업하면서, 데이터 생산만으로는 사업성이 약하다고 판단해 데이터 정제와 주석 서비스, 특수 도구 개발까지 사업 범위를 넓혔다.

ABC-130K 공개… 고객 20곳 확보

이번에 공개된 ABC-130K는 XDOF의 역량을 보여주는 대표 사례다. 데이터셋에는 로봇 조작 데이터 13만개의 궤적 정보와 시뮬레이션 300시간, 평가 100시간이 포함됐다. 회사는 이를 활용해 티셔츠 접기, 골판지 상자 펴기, 에어팟을 플라스틱 케이스에 넣기 같은 높은 정밀도가 필요한 작업을 로봇에게 학습시켰다고 밝혔다.

그동안 외부에 크게 알려지지 않았지만, XDOF는 이미 약 20곳의 고객사를 확보한 상태다. 여기에는 최첨단 AI 연구소들도 포함돼 있으며, 직원 수는 60명을 넘는다. 아직 초기 기업이지만 단순 실험 단계를 넘어 실제 수요를 확인했다는 점은 눈여겨볼 대목이다.

‘데이터 피라미드’로 확장… 대규모 운영 인력도 구축

우는 앞으로 XDOF 사업을 3단계 ‘데이터 피라미드’ 구조로 확장하겠다고 밝혔다. 최상단은 특정 로봇을 직접 원격 조작해 얻는 맞춤형 데이터다. 중간층은 GELLO와 유사한 범용 원격조작 데이터다. 하단은 사람이 일상적인 작업을 수행하는 모습을 수집한 ‘자기중심적’ 데이터로, 로봇이 일상 동작을 배우는 데 활용된다.

이 체계를 실제로 굴리려면 대규모 자금과 인력이 필요하다. XDOF는 전 세계 단위의 원격조작 인력과 데이터 수집 인력을 채용할 계획이다. 여기에 손 추적 알고리즘의 정확도를 높이기 위해 자체 웨어러블 센서도 개발할 방침이다.

결국 XDOF가 노리는 기회는 명확하다. 로봇 학습 데이터 구축은 창고, 다수의 로봇, 유지보수, 물리 파라미터 보정, 운영자 교육까지 필요한 노동집약적 작업이다. AI 연구소 입장에서는 직접 구축하기보다 외부 전문 기업에 맡길 유인이 크다. ‘피지컬 AI’ 경쟁이 본격화할수록, XDOF 같은 데이터 인프라 기업의 존재감도 함께 커질 가능성이 있다.

TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.
본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

많이 본 기사

지금 꼭 알아야 할 리포트