맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

DeepSeek, 대규모 모델 학습 안정성 위한 'mHC' 아키텍처 논문 발표

프로필
토큰포스트 속보
댓글 0
좋아요 비화설화 0
 DeepSeek, 대규모 모델 학습 안정성 위한 'mHC' 아키텍처 논문 발표

암호화폐 기술 전문 매체 PANews에 따르면, 딥러닝 연구 조직 DeepSeek은 1월 1일 대규모 AI 모델의 학습 안정성과 확장성 문제를 해결하기 위한 새로운 아키텍처 ‘Manifold Constrained Hyperconnectivity(mHC)’를 제안하는 논문을 발표했다. 이 논문은 기존 Hyperconnected Networks(HC) 구조에서 발생하는 항등 매핑 속성 위반으로 인한 학습 불안정 문제를 지적하며, 이를 개선하기 위해 HC의 잔여 연결 공간을 특정 매니폴드로 제한해 항등 매핑 속성을 복원하는 방식의 mHC 구조를 도입했다. 또한 인프라 효율성을 고려한 최적화 기술도 함께 적용해 모델 성능과 확장성을 크게 향상시켰다는 설명이다. DeepSeek은 mHC가 향후 AI 모델 토폴로지 설계에 기여하고 기본 모델 발전에 있어 유망한 방향성을 제시할 수 있을 것으로 기대된다고 밝혔다. 해당 논문은 Liang Wenfeng, Zhenda Xie, Yixuan Wei, Huanqi Cao 등이 공동 저자로 참여했다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

주요 기사

[토큰포스트 칼럼] 은(銀)은 왜 급등했을까…시장이 찾는 '자산의 조건', 그리고 비트코인

[토큰포스트 칼럼] 은(銀)은 왜 급등했을까…시장이 찾는 '자산의 조건', 그리고 비트코인

[BBR Vol. 16]

[BBR Vol. 16] "AI가 지갑을 갖고 스스로 거래한다"… 2026년 '에이전틱 이코노미'가 몰고 올 새로운 금융질서

팟캐스트 Ep.317ㅡAI 시대의 블록체인, 0G는 왜 ‘세 가지 파편화’를 하나로 묶었나

팟캐스트 Ep.317ㅡAI 시대의 블록체인, 0G는 왜 ‘세 가지 파편화’를 하나로 묶었나

팟캐스트 Ep.316ㅡ올해 비트코인, 왜 산타랠리를 놓쳤나…파생상품 시장이 보여준 시그널

팟캐스트 Ep.316ㅡ올해 비트코인, 왜 산타랠리를 놓쳤나…파생상품 시장이 보여준 시그널

댓글

댓글

0

추천

0

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1