日 라쿠텐, 일본어 특화 대규모 오픈소스 AI 모델 공개…DeepSeek V3 기반 의혹

| 토큰포스트 속보

일본 라쿠텐그룹이 오픈소스 대규모 언어모델 ‘Rakuten AI 3.0’을 공개하고, 이를 “일본 최대 고성능 AI 모델”이라고 밝혔다.

라쿠텐에 따르면 이 모델은 전문가 혼합(MoE) 구조를採용했으며, 총 6710억개 파라미터를 보유하고 매 추론 시 약 370억개 파라미터가 활성화된다. 컨텍스트 윈도우는 128K로, 일본어 환경에 최적화돼 다수의 일본어 벤치마크에서 GPT-4o를 상회하는 성능을 보였다고 설명했다.

Rakuten AI 3.0은 일본 경제산업성과 신에너지산업기술종합개발기구(NEDO)가 추진하는 GENIAC 프로젝트의 성과 중 하나로, 일부 연산 자원 지원을 받아 개발됐다. 라쿠텐은 기반 모델 출처를 구체적으로 밝히지 않고 “오픈소스 커뮤니티 성과를 토대로 구축했다”고만 언급했다.

다만 커뮤니티가 HuggingFace에 등록된 모델 파일을 분석한 결과, 설정 파일(config.json)에 ‘deepseek_v3’ 및 관련 아키텍처 필드가 포함돼 있고 파라미터 규모와 컨텍스트 구성이 DeepSeek V3와 일치하는 것으로 나타났다. 이를 근거로 Rakuten AI 3.0이 DeepSeek V3를 기반으로 일본어 미세조정을 거친 모델일 가능성이 제기되고 있다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.