인공지능(AI) 추론 특화 클라우드 기업 딥인프라가 시리즈B 투자로 1억700만달러를 확보하며 글로벌 설비 확장에 나선다. 원화 기준으로는 약 1,581억9,250만원 규모다. 생성형 AI가 실험 단계를 넘어 ‘에이전트형 AI’로 이동하는 가운데, 딥인프라는 기존 범용 클라우드의 한계를 파고들겠다는 구상이다.
이번 투자 라운드는 500 글로벌과 구글 클라우드 초기 엔지니어 출신 조지 하릭이 주도했다. 여기에 엔비디아, 삼성전자 투자부문 삼성넥스트, 슈퍼마이크로 컴퓨터($SMCI), A.Capital Ventures, 크레센트 코브, 펠리시스, Peak6, Upper90 등이 참여했다. AI 인프라 시장의 성장성을 주요 투자자들이 동시에 주목했다는 점에서 눈길을 끈다.
딥인프라는 AI 워크로드 가운데서도 ‘추론’에 집중한 기업이다. 추론은 학습을 마친 AI 모델이 실제 서비스 환경에서 사용자의 요청을 처리하는 단계다. 회사 측은 기존 클라우드 플랫폼이 이런 수요를 전제로 설계되지 않았다고 보고 있다. 특히 에이전트형 AI는 한 번의 작업을 수행하기 위해 수십에서 수백 차례 모델 호출이 필요해, 지연 시간과 비용이 급격히 불안정해질 수 있다고 설명했다.
딥인프라는 이를 해결하기 위해 추론을 부가 서비스가 아닌 핵심 공정으로 다루는 일종의 ‘토큰 공장’을 만들고 있다고 밝혔다. 이 회사는 메신저 앱 ‘imo’를 만든 엔지니어 팀이 설립했으며, imo는 전 세계 2억명 이상 사용자로 확장된 바 있다. 대규모 분산 시스템 운영 경험을 AI 추론 인프라에 옮겨오겠다는 전략이다.
기존 사업자들이 외부 유휴 서버인 ‘스팟’ 용량을 빌려 쓰는 방식에 의존하는 것과 달리, 딥인프라는 미국 내 8개 데이터센터에서 자체 하드웨어를 운영하고 있다. 그래픽처리장치(GPU)부터 애플리케이션 프로그래밍 인터페이스(API)까지 전체 스택을 통제해 효율을 끌어올린다는 설명이다. 회사는 엔비디아의 분산 추론 플랫폼 ‘다이너모’와 블랙웰, 베라 루빈 GPU를 활용해 최대 20배 높은 추론 비용 효율성을 제공할 수 있다고 주장했다.
특히 딥인프라는 에이전트형 AI가 기존 생성형 AI 챗봇보다 훨씬 더 많은 자원을 소모한다고 보고 있다. 현재 회사 플랫폼에서 발생하는 전체 토큰 물량의 30% 이상이 이미 자율형 에이전트에서 나오고 있다는 점도 이를 뒷받침한다. 이는 AI 추론 수요가 단순한 챗봇 응답을 넘어 자동화된 업무 처리로 빠르게 이동하고 있음을 보여주는 대목이다.
현재 딥인프라 플랫폼은 엔비디아의 네모트론 계열을 포함한 190개 이상의 오픈소스 AI 모델을 지원한다. 또 민감한 정보를 외부 클라우드에 보내는 데 부담을 느끼는 기업 고객을 겨냥해 ‘제로 데이터 보관’ 정책도 제공하고 있다. 보안과 비용, 속도를 함께 따지는 기업용 AI 시장에서 차별화 포인트를 만들겠다는 의도로 읽힌다.
공동창업자 겸 최고경영자 니콜라 보리소프는 4년 전 회사를 시작할 당시부터 AI 추론이 기업 AI 워크로드의 중심이 될 것으로 봤고, 지금은 그 판단이 현실이 됐다고 말했다. 그는 오픈소스 모델이 빠르게 폐쇄형 모델을 따라잡으면서 더 낮은 비용으로 혁신을 확산시키고 있으며, 에이전트 기반 시스템이 지속적이고 대규모의 수요를 만들고 있다고 진단했다. 이어 AI 추론은 더 이상 얇은 처리 계층이 아니라 향후 대부분의 AI 워크로드를 규정할 ‘병목’이 되고 있다고 강조했다.
500 글로벌의 토니 왕도 AI 추론 수요가 급증하는 가운데 개발자와 엔지니어들이 더 빠르고 유연하며 안정적인 인프라를 필요로 하고 있다고 평가했다. 그는 딥인프라 팀이 이미 글로벌 규모의 분산 시스템을 구축하고 운영할 역량을 입증했으며, 목적형 AI 추론 인프라가 AI 산업의 다음 단계를 떠받칠 핵심 기반이 될 것으로 본다고 밝혔다.
이번 투자 유치는 단순한 자금 조달을 넘어 AI 인프라 경쟁의 무게중심이 학습에서 추론으로 이동하고 있음을 보여준다. 특히 에이전트형 AI 확산이 본격화할수록, 얼마나 빠르고 저렴하게 AI 추론을 처리하느냐가 클라우드 시장의 새로운 승부처가 될 가능성이 커지고 있다.
TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.

