토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

日 사카나AI, 훈련 없이 AI 결합하는 '모델 융합' 기술 공개…비용·성능 혁신 주목

프로필
김민준 기자
댓글 0
좋아요 비화설화 2

일본 사카나AI가 기존 AI 모델을 재훈련 없이 병합하는 진화 알고리즘 'M2N2'를 출시해 주목받고 있다. 이 기술은 비용 효율성과 높은 성능을 강점으로 다양한 산업 응용 가능성을 내비쳤다.

 日 사카나AI, 훈련 없이 AI 결합하는 '모델 융합' 기술 공개…비용·성능 혁신 주목 / TokenPost.ai

日 사카나AI, 훈련 없이 AI 결합하는 '모델 융합' 기술 공개…비용·성능 혁신 주목 / TokenPost.ai

일본 도쿄에 기반을 둔 스타트업 사카나AI가 고비용 재훈련 없이도 강력한 AI 모델을 구축할 수 있는 진화 알고리즘을 개발해 주목받고 있다. 이 알고리즘은 ‘자연적 니치 기반 모델 병합(Model Merging of Natural Niches·M2N2)’이라는 독특한 접근 방식을 통해 기존 오픈소스 AI 모델을 새롭게 결합하는 데 중점을 둔다. 기존 방식보다 훨씬 효율적이고 비용이 저렴한 이 기술은, 특히 전사적인 AI 도입을 고려 중인 기업들에게 큰 기회를 제공할 것으로 보인다.

사카나AI의 설명에 따르면 M2N2는 대규모 언어 모델(LLM)이나 텍스트-이미지 생성기 등 다양한 형태의 머신러닝 모델에 적용될 수 있다. 핵심은 별도의 원본 훈련 데이터 없이, 서로 다른 특성을 가진 기존 모델의 파라미터(매개변수)를 조합해 새로운 기능을 지닌 모델을 만들어내는 데 있다. 이 방식은 기존의 '파인튜닝(fine-tuning)'처럼 고가의 그래디언트 기반 연산이나 시간 소모적 학습 과정을 필요로 하지 않아, 비용과 시간 모두에서 강점을 지닌다.

모델 병합 기술은 복수의 전문 AI 모델이 지닌 지식을 하나로 통합하려는 시도에서 출발했다. 기존 병합 방식은 대부분 수작업으로 파라미터 조절이 이뤄졌고, 일부 진화 알고리즘 도입이 시도되긴 했지만 여전히 병합 가능한 파라미터를 고정적으로 설정해야 하는 한계가 있었다. 이에 반해 M2N2는 자연의 진화 원리에서 착안한 세 가지 주요 기능을 적용해 이를 극복했다.

첫 번째 특징은 병합 경계의 유연성이다. 기존처럼 층 단위로 고정하지 않고, 병합 비율과 ‘분할 지점(split point)’을 매번 달리 설정해 모델 조합의 폭을 넓힌다. 초기에는 ‘시드(seed)’ 모델 저장소에서 두 개의 모델을 선택하고, 이를 설정된 기준으로 병합한 뒤 성능이 우수한 모델을 다시 저장소에 반영하는 진화 과정을 반복한다.

두 번째는 다양성을 확보하는 진화 전략이다. 단순히 성능이 좋은 모델만 병합하는 기존 방식을 탈피하고, 상호 보완적인 능력을 가진 모델 간의 경쟁과 협업을 시뮬레이션으로 구현한다. 예컨대 특정 데이터셋에서 A 모델이 약점을 보일 때 B 모델이 우수한 성능을 보여주는 조합이 선호되는 구조다. 이를 통해 고유한 전문성을 가진 모델이 생존하고, 전체 저장소의 역량도 점차 탁월해진다.

세 번째 기능은 모델 간 병합 시 ‘매력도(Attraction Score)’를 반영하는 것이다. 단순한 성능 중심의 병합이 아니라, 특정 영역에서 상호 보완하는 성향을 지닌 모델 쌍을 찾아내 더 정교한 병합 시나리오를 구현한다. 그 결과 병합 과정은 더 빠르고, 얻어지는 최종 모델 품질도 더 우수해진다.

실제 실험 결과도 주목할 만하다. 개발진은 손글씨 영상 인식용 MNIST 데이터셋 기반 분류기를 무(無)에서 진화시켜 동급 알고리즘 대비 가장 높은 정확도를 기록했다. 이어 라마2 기반 LLM 모델 두 개를 병합해 수학 문제뿐 아니라 웹 기반 작업을 동시에 수행할 수 있는 하이브리드 모델을 제작했으며, 이미지 생성 부문에서는 일본어 프롬프트와 영어 중심의 스테이블 디퓨전 모델을 결합해 양언어 모두에서 뛰어난 결과를 보여줬다. 특히 일본어로 최적화된 캡션만 사용하고도 영어 프롬프트까지 해석해 사진을 생성하는 ‘이중 언어 처리’ 능력이 자연스럽게 출현한 점은 기술적 진보를 의미한다.

기업 관점에서 본다면, 이 기술은 특정 업무에 특화된 모델을 병합해 복합적 문제 해결 능력을 보유한 단일 AI 에이전트를 만들 수 있음을 시사한다. 예를 들어, 설득력 있는 세일즈 메시지 작성을 훈련받은 LLM에 고객 반응을 파악할 수 있는 비전 모델을 병합해, 실시간 영상 분석을 통해 최적의 영업 전략을 제안하는 단일 AI 시스템을 구현하는 것이 가능해진다.

향후 사카나AI의 연구진은 이 기술이 ‘모델 융합(Model Fusion)’이라는 신개념 트렌드의 서막이 될 것으로 보고 있다. 단 하나의 거대한 AI를 만드는 대신, 다양한 모델이 필요에 따라 병합·분화되며 끊임없이 진화하는 생태계를 구축하겠다는 구상이다.

다만 기술적 정확성 외에도 개인정보 보호와 보안, 컴플라이언스 이슈 등 조직 내 도입을 위한 사전 검토가 필수적이다. 오픈소스와 상업용, 그리고 커스텀 모델이 복합된 환경에서 어떤 모델을 병합할 수 있는지에 대한 가이드라인이 마련돼야 한다는 점도 과제로 지적된다.

현재 M2N2의 알고리즘은 오픈소스로 GitHub에 공개돼 있으며, 다양한 테스트를 거쳐 더 많은 산업 분야에서 활용될 기반을 마련하고 있다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

댓글

댓글

0

추천

2

스크랩

스크랩

데일리 스탬프

2

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

등급

WayneKIM

10:55

등급

위당당

10:37

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1