맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

日 사카나AI, 인간처럼 '생각하는' 신형 AI CTM 공개…트랜스포머 넘을까

작성자 이미지
김민준 기자
0
0

사카나AI가 인간 사고를 모방한 AI 아키텍처 ‘CTM’을 발표하며 기존 트랜스포머와 다른 진화적 학습 모델을 제시했다. 구글 브레인 출신 창업자가 이끄는 이 스타트업은 해석 가능성과 적응력을 중심으로 AI 생태계에 도전장을 던졌다.

日 사카나AI, 인간처럼 '생각하는' 신형 AI CTM 공개…트랜스포머 넘을까 / TokenPost Ai

일본 도쿄에 본사를 둔 인공지능 스타트업 사카나AI가 인간 두뇌의 사고 과정을 모방한 신형 AI 모델 아키텍처 ‘CTM(Continuous Thought Machines)’을 선보였다. 사카나는 구글 브레인 출신의 AI 과학자 리온 존스(Llion Jones)와 데이비드 하(David Ha)가 공동 설립한 회사로, 이번 아키텍처는 기존 트랜스포머 모델과는 완전히 다른 접근 방식으로 주목받고 있다.

CTM은 입력값 처리 방식을 획기적으로 바꿨다. 기존 트랜스포머는 모든 계산 과정을 한 번에 병렬로 처리하는 반면, CTM은 각 인공 뉴런이 자체적인 ‘시간축’을 기준으로 정보를 순차적으로 해석하고 반응을 결정한다. 뉴런별로 메모리를 유지하고, 과거 활성화 시점을 참고해 다음 동작 여부를 판단하는 구조다. 이를 통해 복잡한 문제에 직면했을 때는 보다 깊이 있는 연산을 수행하고, 단순한 작업에 대해서는 계산을 간소화할 수 있다.

정해진 계층 구조 없이 각 뉴런이 언제, 얼마나 오랫동안 정보를 처리할지 자율적으로 판단하는 이 같은 방식은 전통적인 딥러닝 구조에서 벗어난 생물학적 사고 모델에 가깝다는 점에서 AI 연구계의 이목을 끌고 있다. 사카나는 CTM을 “진화에 기반한 정보 처리 시스템”이라 정의하면서, 장기적으로 인간 수준의 지능을 목표로 삼고 있다고 밝혔다.

초기 성능 지표에서도 독창성이 드러난다. 이미지넷-1K(ImageNet-1K) 벤치마크에서 CTM은 탑-1 정확도 72.47%, 탑-5 정확도 89.89%를 기록했다. 이는 구글의 ViT나 메타의 ConvNeXt와 같은 최첨단 트랜스포머 기반 모델보다는 낮지만, CTM이 기존 방식과 근본적으로 다르다는 점을 고려하면 상당히 의미 있는 수치로 평가된다. 특히 단계를 나눠 훈련 없이 문제를 ‘사고’하는 CTM의 특성상 해석 가능성과 적응성 측면에서는 더 강점을 보였다.

실제 데모에서 CTM은 2D 미로 문제를 해결하거나 이미지 인식 과정에서 사람과 유사한 주목 패턴을 보였다. 예컨대 얼굴을 인식할 때 눈, 코, 입 순서대로 주목해 나가는 방식이다. 또한 그 예측 결과에 대한 자신감이 실제 정확도와 자연스럽게 일치하는 ‘보정력(calibration)’도 뛰어나, 별도의 온도 조정 없이 신뢰도 높은 예측을 제공했다.

하지만 사카나는 현재 CTM이 상업용 수준에는 이르지 못했다고 강조했다. 기존 모델에 비해 훈련 시 더 많은 자원이 들고, 내부 시간 단위(tick)에 따른 연산 흐름을 안정적으로 유지하기 위한 튜닝이 복잡하며, 디버깅 툴도 아직 충분치 않다는 설명이다. 그럼에도 사카나는 이 아키텍처를 오픈소스 형태로 공개하고 있으며, 이미지 분류, 미로 탐색, QMNIST, 강화학습 등 다양한 벤치마크 도구와 시각화 인터페이스를 함께 제공해 연구자 친화적인 환경을 적극 조성하고 있다.

사카나의 연구 철학은 ‘진화적 학습’에 기반한다. 정적인 모델 구조를 벗어나 사용 환경에 따라 동적으로 변화하고, 정보 흐름을 자율적으로 조율하며, 새로운 작업에 대해 재학습 없이 적응하는 시스템 구축이 이 회사의 목표다. 실제로 이전에는 ‘AI CUDA 엔지니어’라는 명칭의 코드 자동 최적화 AI 시스템을 선보였고, 이는 GPU 코드 병렬 처리 효율성을 획기적으로 개선할 수 있다는 기대를 모은 바 있다. 다만, 출시 초기 평가 과정에서 메모리 취약점을 악용했다는 논란이 제기되며 일시적으로 신뢰도에 금이 간 적도 있었다. 당시 사카나는 이를 인정하고 평가 체계를 전면 수정했다.

기업 고객 관점에서 볼 때 CTM은 높은 신뢰성과 계산 효율성, 해석 가능성을 갖춘 차세대 대안으로 주목할 만하다. 특히 입력 복잡도가 다양한 환경이나 높은 규제 기준을 요구하는 분야에서는 CTM의 점진적 추론 구조와 메모리 기반 사고 패턴이 강점으로 작용할 수 있다. 또한 다단계 연산을 가능하게 하는 CTM의 내부 구조는 전통적인 MLOps 환경과도 호환될 수 있게 설계돼, 향후 표준 추론 파이프라인에 탑재될 가능성도 있다.

사카나는 대형 모델 경쟁에서 벗어나, 작고 유연한 AI 아키텍처의 가능성에 베팅하고 있다. CTM은 아직 실험적 단계에 머물러 있지만, 지능적 판단과 진화적 학습이라는 새로운 방향성을 제시하며 AI 생태계에 중요한 전환점을 만들어가고 있다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

0

추천

0

스크랩

Scrap

데일리 스탬프

0

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1