맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

日 라쿠텐, 일본어 특화 대규모 오픈소스 AI 모델 공개…DeepSeek V3 기반 의혹

프로필
토큰포스트 속보
댓글 0
좋아요 비화설화 0
 日 라쿠텐, 일본어 특화 대규모 오픈소스 AI 모델 공개…DeepSeek V3 기반 의혹

일본 라쿠텐그룹이 오픈소스 대규모 언어모델 ‘Rakuten AI 3.0’을 공개하고, 이를 “일본 최대 고성능 AI 모델”이라고 밝혔다.

라쿠텐에 따르면 이 모델은 전문가 혼합(MoE) 구조를採용했으며, 총 6710억개 파라미터를 보유하고 매 추론 시 약 370억개 파라미터가 활성화된다. 컨텍스트 윈도우는 128K로, 일본어 환경에 최적화돼 다수의 일본어 벤치마크에서 GPT-4o를 상회하는 성능을 보였다고 설명했다.

Rakuten AI 3.0은 일본 경제산업성과 신에너지산업기술종합개발기구(NEDO)가 추진하는 GENIAC 프로젝트의 성과 중 하나로, 일부 연산 자원 지원을 받아 개발됐다. 라쿠텐은 기반 모델 출처를 구체적으로 밝히지 않고 “오픈소스 커뮤니티 성과를 토대로 구축했다”고만 언급했다.

다만 커뮤니티가 HuggingFace에 등록된 모델 파일을 분석한 결과, 설정 파일(config.json)에 ‘deepseek_v3’ 및 관련 아키텍처 필드가 포함돼 있고 파라미터 규모와 컨텍스트 구성이 DeepSeek V3와 일치하는 것으로 나타났다. 이를 근거로 Rakuten AI 3.0이 DeepSeek V3를 기반으로 일본어 미세조정을 거친 모델일 가능성이 제기되고 있다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1
오늘 하루 열지 않음[닫기] Close

토큰포스트 프리미엄 멤버십, 이 모든 혜택을 무료로 시작하세요

AI신호 + 60강좌 + BBR매거진 + 에어드랍 WL 기회까지!