실시간 추론 최적화 스타트업 런웨어(Runware)가 시리즈 A 투자 라운드에서 5,000만 달러(약 720억 원)를 유치하며 본격 성장에 시동을 걸고 있다. 다윈 캐피털을 주축으로 컴캐스트 벤처스, 인사이트 파트너스, a16z 스피드런, 스피드인베스트 등 유력 벤처캐피털이 대거 참여했다. 이번 투자로 런웨어의 누적 조달액은 6,600만 달러(약 950억 원)에 이른다.
2023년 루마니아 개발자 듀오 플라비우 라둘레스쿠와 요아나 흐레닌치우크가 창업한 런웨어는 이미지·비디오·오디오 생성을 위한 AI 실시간 추론 속도를 획기적으로 개선하겠다는 목표로 시작됐다. 이들은 초기 생성AI 도구의 느린 추론 속도에 불만을 느낀 끝에, 자체적인 최적화 접근법을 개발하게 됐다.
런웨어는 블로그를 통해 AI 대중화를 가로막는 주요 장애물이 느린 추론 속도이며, 이는 사용자 경험을 심각하게 저해한다고 설명했다. 또, 주요 LLM(초거대언어모델)의 단편적인 접근성과 과도한 비용 역시 문제로 지적했다. 이를 해소하기 위해 런웨어는 맞춤형 AI 추론 하드웨어와 최적화된 소프트웨어 스택을 결합해 기존 데이터센터 대비 최대 10배 빠르고 저렴한 성능을 구현했다고 밝혔다.
런웨어의 핵심 역량은 '소닉 인퍼런스 엔진(Sonic Inference Engine)'과 자체 설계된 하드웨어에 있다. API 기반 연동 방식을 통해 고객은 특정 LLM의 인프라나 별도 통합 과정 없이도 앱에 통합할 수 있다. 또한 오픈소스 모델 최적화에 집중하며 신규 릴리스에 대해 '제로-데이' 접근을 제공, 최신 모델을 즉시 대응할 수 있다.
소프트웨어 측면에선 모델 로딩과 오프로딩까지 극단적으로 최적화해 40만 개 이상의 모델을 실시간 추론 가능하게 지원하고 있다. 흐레닌치우크는 테크크런치와의 인터뷰에서 “모든 지능형 애플리케이션을 위한 범용 API가 되는 것이 목표”라며, 향후 200만 개 이상의 모델을 지원하고, 이미지·비디오·오디오 외 추가 AI 모달리티 확장에도 나설 계획을 밝혔다.
런웨어는 설립 2년 만에 10억 회 이상 결과물을 생성했고, 이를 통해 20만 명 이상의 개발자와 3억 명에 이르는 글로벌 최종 사용자를 지원했다. 주요 고객사로는 토게더 컴퓨터, 지식 플랫폼 쿼라, 이미지 공유 사이트 프리픽, 웹사이트 제작 서비스 윅스 등이 있다.
한편 런웨어는 추론 최적화 시장에서 팔닷에이아이(Fal.ai), 리플리케이트(Replicate) 등과 경쟁 중이다. 팔닷에이아이는 최근 1억 4,000만 달러(약 2,000억 원)를 유치하며 45억 달러(약 6조 4,800억 원) 기업가치를 인정받았지만, 추론 속도보다 모델 범위 확대에 초점을 두고 있다. 런웨어는 이러한 경쟁사들과 달리 비용 구조에서도 차별화를 꾀하고 있다. 기존 업체들이 연산 시간에 따른 과금 방식인 반면, 런웨어는 결과물 단가 기반으로 고객이 필요한 만큼만 비용을 지불하게 한다.
이번 투자를 계기로 런웨어는 기술 고도화와 생태계 확장 모두에 드라이브를 걸 전망이다. AI 추론의 병목을 해소하겠다는 전략이 실제 산업 현장에서 어떤 변화를 만들어낼지 주목된다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>