AI 추론비용 80% 절감…르뮤리안랩스, 2,800만 달러 투자 유치

김민준 기자

2025.12.03 (수) 23:25

르뮤리안랩스가 GPU 호환 AI 컴파일러 '타키온' 개발을 위해 2,800만 달러를 조달했다. 타키온은 다양한 GPU에서 AI 모델을 성능 저하 없이 실행하며 비용도 최대 80% 절감 가능하다고 밝혔다.

AI 추론비용 80% 절감…르뮤리안랩스, 2,800만 달러 투자 유치 / TokenPost.ai

AI 모델 최적화 툴을 개발하는 스타트업 르뮤리안랩스(Lemurian Labs)가 최근 시리즈A 라운드에서 2,800만 달러(약 403억 2,000만 원)를 신규 조달했다. 이번 투자에는 페블베드 벤처스와 헥사곤이 공동 리드로 참여했으며, 기존 투자자인 오벌 파크 캐피털을 포함한 6곳 이상의 투자사가 함께 했다.

르뮤리안랩스는 미국 캘리포니아주 산타클라라에 본사를 둔 스타트업으로, 이 회사가 개발 중인 AI 컴파일러 '타키온(Tachyon)'은 여러 GPU 제조사에 상관없이 동일한 AI 모델을 손쉽게 실행할 수 있도록 도와주는 툴이다. 일반적으로 AI 모델은 특정 GPU 제조사의 아키텍처에 맞춰 고도화된 커널 단위로 구성되고, 다른 업체의 GPU에서 이를 실행하려면 전문 기술자가 수작업으로 포팅해야 하는 고비용 작업이 필요한 문제가 있다.

타키온은 이러한 병목을 해소하는 소프트웨어다. 개발자는 모델을 한 번 작성하면, 별다른 수정 없이 NVIDIA, 인텔, AMD 등의 주요 GPU에서 모두 동일하게 실행할 수 있다. 특히 이 과정에서 성능까지 향상된다는 점이 핵심 경쟁력이다. 회사 측에 따르면 타키온을 활용하면 추론 비용을 최대 80%까지 절감할 수 있다.

커널 간 연산 과정에서 데이터를 메모리로 이동하는 횟수가 AI 추론 속도에 직접적인 영향을 미치는데, 타키온은 이 데이터를 한 번에 묶어 처리하는 '연산자 융합(operator fusion)' 기법을 적용한다. 이를 통해 GPU 코어가 데이터 대기 없이 연산을 이어갈 수 있어 하드웨어 효율성이 전반적으로 개선된다.

또한 타키온은 파이썬 기반의 전용 언어 '타키온 DSL'을 도입해 개발자가 컴파일 방식을 유연하게 조절할 수 있도록 설계됐다. 배포 이후에도 동적 런타임 기능을 통해 모델 성능을 지속적으로 최적화할 수 있다는 점도 차별화 포인트다.

페블베드 벤처스의 설립자 키스 애덤스는 "르뮤리안은 AI 하드웨어-소프트웨어 사이의 이분법적 한계를 근본적으로 재정의하고 있다"며, 기존 플랫폼 종속성과 코드 재작성 부담을 동시에 해소하는 접근법에 주목했다.

르뮤리안은 내년 여름을 목표로 타키온의 베타버전을 출시할 예정이며, 이번 투자금을 활용해 고급 엔지니어 인재 채용과 파트너 생태계 확대에 집중한다는 계획이다. AI 인프라의 다변화가 가속화되는 가운데, 타키온과 같은 중간 계층 최적화 솔루션의 필요성은 향후 더욱 부각될 것으로 보인다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

광고문의 기사제보 보도자료

#스타트업펀딩 #인공지능 #AI컴파일러 #GPU최적화

텔레그램에서 토큰포스트 속보 보기