맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

AI 추론비용 80% 절감…르뮤리안랩스, 2,800만 달러 투자 유치

프로필
김민준 기자
댓글 0
좋아요 비화설화 0

르뮤리안랩스가 GPU 호환 AI 컴파일러 '타키온' 개발을 위해 2,800만 달러를 조달했다. 타키온은 다양한 GPU에서 AI 모델을 성능 저하 없이 실행하며 비용도 최대 80% 절감 가능하다고 밝혔다.

 AI 추론비용 80% 절감…르뮤리안랩스, 2,800만 달러 투자 유치 / TokenPost.ai

AI 추론비용 80% 절감…르뮤리안랩스, 2,800만 달러 투자 유치 / TokenPost.ai

AI 모델 최적화 툴을 개발하는 스타트업 르뮤리안랩스(Lemurian Labs)가 최근 시리즈A 라운드에서 2,800만 달러(약 403억 2,000만 원)를 신규 조달했다. 이번 투자에는 페블베드 벤처스와 헥사곤이 공동 리드로 참여했으며, 기존 투자자인 오벌 파크 캐피털을 포함한 6곳 이상의 투자사가 함께 했다.

르뮤리안랩스는 미국 캘리포니아주 산타클라라에 본사를 둔 스타트업으로, 이 회사가 개발 중인 AI 컴파일러 '타키온(Tachyon)'은 여러 GPU 제조사에 상관없이 동일한 AI 모델을 손쉽게 실행할 수 있도록 도와주는 툴이다. 일반적으로 AI 모델은 특정 GPU 제조사의 아키텍처에 맞춰 고도화된 커널 단위로 구성되고, 다른 업체의 GPU에서 이를 실행하려면 전문 기술자가 수작업으로 포팅해야 하는 고비용 작업이 필요한 문제가 있다.

타키온은 이러한 병목을 해소하는 소프트웨어다. 개발자는 모델을 한 번 작성하면, 별다른 수정 없이 NVIDIA, 인텔, AMD 등의 주요 GPU에서 모두 동일하게 실행할 수 있다. 특히 이 과정에서 성능까지 향상된다는 점이 핵심 경쟁력이다. 회사 측에 따르면 타키온을 활용하면 추론 비용을 최대 80%까지 절감할 수 있다.

커널 간 연산 과정에서 데이터를 메모리로 이동하는 횟수가 AI 추론 속도에 직접적인 영향을 미치는데, 타키온은 이 데이터를 한 번에 묶어 처리하는 '연산자 융합(operator fusion)' 기법을 적용한다. 이를 통해 GPU 코어가 데이터 대기 없이 연산을 이어갈 수 있어 하드웨어 효율성이 전반적으로 개선된다.

또한 타키온은 파이썬 기반의 전용 언어 '타키온 DSL'을 도입해 개발자가 컴파일 방식을 유연하게 조절할 수 있도록 설계됐다. 배포 이후에도 동적 런타임 기능을 통해 모델 성능을 지속적으로 최적화할 수 있다는 점도 차별화 포인트다.

페블베드 벤처스의 설립자 키스 애덤스는 "르뮤리안은 AI 하드웨어-소프트웨어 사이의 이분법적 한계를 근본적으로 재정의하고 있다"며, 기존 플랫폼 종속성과 코드 재작성 부담을 동시에 해소하는 접근법에 주목했다.

르뮤리안은 내년 여름을 목표로 타키온의 베타버전을 출시할 예정이며, 이번 투자금을 활용해 고급 엔지니어 인재 채용과 파트너 생태계 확대에 집중한다는 계획이다. AI 인프라의 다변화가 가속화되는 가운데, 타키온과 같은 중간 계층 최적화 솔루션의 필요성은 향후 더욱 부각될 것으로 보인다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1