네비우스, 아이겐AI 인수로 ‘AI 추론 최적화’ 경쟁 뛰어들었다

| 손정환 기자

네덜란드 인공지능 데이터센터 운영사 네비우스 그룹 NV가 소프트웨어 기업 아이겐AI를 6억4,300만달러, 원화 약 9,485억원에 인수하기로 했다. 단순 인프라 확장을 넘어 ‘AI 추론’과 ‘모델 최적화’ 역량까지 내재화하려는 움직임으로 해석된다.

네비우스는 이번 거래를 현금과 주식으로 조달하며, 수 주 안에 인수를 마무리할 계획이라고 밝혔다. 회사는 개발자들이 AI 모델 학습과 추론에 활용할 수 있는 그래픽처리장치(GPU) 클러스터를 제공하고 있으며, GPU 운영 부담을 줄인 관리형 추론 서비스 ‘토큰 팩토리(Token Factory)’도 운영 중이다.

이번 인수의 핵심은 아이겐AI 기술을 토큰 팩토리에 접목해 오픈소스 AI 모델의 속도와 하드웨어 효율을 끌어올리는 데 있다. 토큰 팩토리는 현재 10종이 넘는 오픈소스 AI 모델 기반 추론을 지원하는데, 아이겐AI의 소프트웨어는 이들 모델의 일부 기본 ‘커널’을 더 빠른 맞춤형 모듈로 교체해 성능을 개선한다. 해당 모듈은 엔비디아 칩과 연동하는 ‘쿠다(CUDA)’와 AI 개발에 최적화된 프로그래밍 언어 ‘트라이턴(Triton)’으로 구현된 것으로 전해졌다.

메모리 절감·응답 속도 개선…오픈소스 모델 성능 최적화

아이겐AI는 커널 교체 외에도 오픈소스 AI 모델의 여러 요소를 함께 최적화한다. 입력 데이터를 처리하는 방식에 영향을 주는 ‘가중치(weights)’를 압축해 메모리 사용량을 줄이고, 대형언어모델이 프롬프트 응답에 활용하는 ‘KV 캐시’도 개선해 처리 효율을 높인다는 설명이다.

네비우스는 특히 아이겐AI의 ‘포스트 트레이닝’ 기능에 주목하고 있다. 포스트 트레이닝은 이미 학습된 모델을 추가로 미세조정해 출력 품질을 높이는 과정이다. 일반적으로는 다수의 파라미터를 다시 조정해야 해 상당한 컴퓨팅 자원이 필요한데, 아이겐AI는 ‘로라(LoRA)’ 방식으로 이 부담을 줄인다.

로라는 기존 신경망에 소수의 외부 파라미터를 덧붙인 뒤, 미세조정 과정에서 새 파라미터만 재보정하는 방식이다. 대규모 기존 설정을 광범위하게 다시 손보는 것보다 훨씬 빠르고 효율적이라는 평가를 받는다. AI 인프라 기업 입장에선 적은 자원으로 더 나은 추론 품질을 제공할 수 있다는 점에서 사업성이 크다.

AI 인프라 경쟁, 하드웨어에서 소프트웨어 최적화로 확대

아이겐AI는 핵심 모델 최적화 기술 외에도 학습 데이터셋 구축 속도를 높이는 ‘아이겐 데이터’, AI 모델 지연 시간을 낮추는 클라우드 서비스 ‘아이겐 인퍼런스’ 등을 제공하고 있다. 인수 완료 후 아이겐AI 임직원은 네비우스에 합류하며, 네비우스는 이들을 중심으로 미국 베이 지역에 새로운 엔지니어링 허브를 세울 계획이다.

이번 거래는 AI 업계 경쟁 축이 단순 GPU 확보를 넘어 ‘소프트웨어 기반 최적화’로 옮겨가고 있음을 보여준다. 고성능 반도체 수급이 여전히 중요한 변수이지만, 실제 시장에서는 같은 인프라로 더 빠르고 저렴하게 추론 서비스를 제공하는 역량이 점점 더 중요해지고 있다. 네비우스의 아이겐AI 인수도 이런 흐름 속에서 ‘AI 인프라 효율화’ 경쟁을 한층 가속할 가능성이 크다.

TP AI 유의사항 TokenPost.ai 기반 언어 모델을 사용하여 기사를 요약했습니다. 본문의 주요 내용이 제외되거나 사실과 다를 수 있습니다.
본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

많이 본 기사

지금 꼭 알아야 할 리포트