토픽

맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

독일서 등장한 ‘R1T2 Chimera’, 기존 LLM보다 2배 빠른 AI 나온다

프로필
김민준 기자
댓글 0
좋아요 비화설화 0

독일 TNG가 개발한 R1T2 Chimera가 딥시크 모델보다 2배 빠른 처리 속도와 60% 짧은 응답을 제공한다고 밝혔다. 오픈소스로 공개되며 유럽의 AI 규제 속에서도 산업적 활용 가능성에 주목받고 있다.

 독일서 등장한 ‘R1T2 Chimera’, 기존 LLM보다 2배 빠른 AI 나온다 / TokenPost Ai

독일서 등장한 ‘R1T2 Chimera’, 기존 LLM보다 2배 빠른 AI 나온다 / TokenPost Ai

중국 인공지능 스타트업 딥시크(DeepSeek)가 지난 5월 공개한 오픈소스 LLM ‘DeepSeek R1-0528’은 공개 직후부터 전 세계 기업과 개발자들의 뜨거운 반응을 끌어냈다. 그리고 불과 한 달여 만에 이보다 최대 200% 빠른 성능을 갖춘 변형 모델이 독일에서 등장해 업계를 놀라게 하고 있다. 주인공은 독일의 기술 컨설팅 기업 TNG 테크놀로지 컨설팅(TNG Technology Consulting GmbH)이다.

TNG는 최근 ‘DeepSeek R1T2 Chimera’ 모델을 공개했다. 이 모델은 딥시크의 기존 LLM들을 기반으로 독자적인 ‘전문가 조합(Assembly-of-Experts, AoE)’ 기법을 적용해 구성됐다. 특히 단어 수를 획기적으로 줄이면서도 기존 모델과 동등한 수준의 추론 능력을 보유한 것이 특징이다. 내부 벤치마크에 따르면, R1T2는 R1-0528 모델보다 출력 토큰 수가 약 60% 적고, 처리 속도는 약 2배 빨라졌다.

이러한 성능 향상은 단순한 아키텍처 변경이 아닌, 사전에 학습된 서로 다른 모델 간의 ‘전문가 텐서(Expert Tensor)’를 선택적으로 병합하는 방식에 의해 가능해졌다. TNG는 R1-0528 외에도 DeepSeek R1, DeepSeek V3-0324 등 세 가지 모델의 강점을 조합해 새로운 구조 ‘Tri-Mind’를 구성했다. 이를 통해 고도화된 추론 능력과 함께 짧고 빠른 응답을 제공할 수 있게 됐다.

기존 LLM에서 흔히 사용됐던 ‘혼합 전문가(Mixture-of-Experts, MoE)’ 방식이 토큰 단위 조건에 따라 모델 일부분만 활성화하는 반면, AoE는 여러 모델의 내부 파라미터를 실제로 병합해 전혀 새로운 모델을 만드는 접근이다. TNG는 이 방식이 고급 추론에 필요한 복잡한 구조만 유지하면서도, 응답성을 키우는 데 효과적이라고 설명한다.

성능 수치도 우수하다. TNG 측이 공개한 벤치마크 자료에 따르면, R1T2는 AIME-24, AIME-25, GPQA-Diamond 등 주요 테스트에서 최고 수준의 모델인 R1-0528의 90~92%에 해당하는 추론 능력을 보인다. 그러나 응답 길이는 훨씬 짧아, 효율성과 지연 시간 측면에서 압도적인 이점을 확보했다.

R1T2는 현재 오픈소스 플랫폼 허깅페이스(Hugging Face)에서 MIT 라이선스로 무료 공개 중이다. 이는 기업들이 자체 서버에 배포하거나 맞춤형으로 모델을 조정할 수 있다는 것을 의미한다. 단, 기능 호출(Function Calling)이나 고도화된 에이전트 구성과 같은 복합 작업에는 적합하지 않다는 한계점도 있다. 이는 R1 계열이 근본적으로 가지고 있는 구조적 한계로, 향후 업데이트에서 개선될 여지가 있다.

특히 유럽 시장에서는 모델 사용과 관련해 새로운 규제 이슈도 부상하고 있다. 오는 8월 2일부터 발효되는 ‘EU AI 법안’은 범용 AI 모델에 대한 책임과 투명성을 강화하고 있기 때문이다. TNG는 유럽 내 사용자는 사전 법률 검토를 거쳐야 하며, 조건을 충족하지 못할 경우 사용 중단도 고려해야 한다고 안내했다. 반면, 미국 내에서만 운영되거나 미국 외 국가를 대상으로 배포하는 기업들은 이러한 규제 영향을 받지 않기에 활용 여지가 크다.

TNG는 이미 이전 Chimera 시리즈 모델들을 통해 수십억 개 토큰을 실시간 처리해 온 경험이 있으며, 이번 R1T2 모델은 그 개발 철학과 오픈소스 정신을 그대로 계승하고 있다. 또한 기업 대상 AI 솔루션, 소프트웨어 개발, DevOps 환경 지원 등에서도 활발히 활동하고 있는 기술 중심 컨설팅 기업으로서, 이번 모델 출시를 통해 다시 한번 독자적인 기술력을 입증했다.

이번 R1T2 Chimera는 단순히 빠른 AI 모델 이상의 의미를 가진다. 업무 처리 속도와 비용 절감이 요구되는 엔터프라이즈 환경에서 실질적인 효율성을 갖춘 솔루션으로, 기술 책임자와 AI 플랫폼 관리자, IT 구매 결정권자에게 전략적인 선택지를 새롭게 제시하고 있는 셈이다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1