맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크 복사 완료 링크가 복사되었습니다.

DeepSeek, 대규모 모델 학습 안정성 위한 'mHC' 아키텍처 논문 발표

프로필
토큰포스트 속보
댓글 0
좋아요 비화설화 1
 DeepSeek, 대규모 모델 학습 안정성 위한 'mHC' 아키텍처 논문 발표

암호화폐 기술 전문 매체 PANews에 따르면, 딥러닝 연구 조직 DeepSeek은 1월 1일 대규모 AI 모델의 학습 안정성과 확장성 문제를 해결하기 위한 새로운 아키텍처 ‘Manifold Constrained Hyperconnectivity(mHC)’를 제안하는 논문을 발표했다. 이 논문은 기존 Hyperconnected Networks(HC) 구조에서 발생하는 항등 매핑 속성 위반으로 인한 학습 불안정 문제를 지적하며, 이를 개선하기 위해 HC의 잔여 연결 공간을 특정 매니폴드로 제한해 항등 매핑 속성을 복원하는 방식의 mHC 구조를 도입했다. 또한 인프라 효율성을 고려한 최적화 기술도 함께 적용해 모델 성능과 확장성을 크게 향상시켰다는 설명이다. DeepSeek은 mHC가 향후 AI 모델 토폴로지 설계에 기여하고 기본 모델 발전에 있어 유망한 방향성을 제시할 수 있을 것으로 기대된다고 밝혔다. 해당 논문은 Liang Wenfeng, Zhenda Xie, Yixuan Wei, Huanqi Cao 등이 공동 저자로 참여했다.

본 기사는 시장 데이터 및 차트 분석을 바탕으로 작성되었으며, 특정 종목에 대한 투자 권유가 아닙니다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

alpha icon

지금 꼭 알아야 할 리포트

미션

매일 미션을 완료하고 보상을 획득!

미션 말풍선 닫기
말풍선 꼬리
출석 체크

출석 체크

0 / 0

기사 스탬프

기사 스탬프

0 / 0

관련된 다른 기사

주요 기사

4월 24일 퇴근길 팟캐스트 — 리플 2.94억달러 롱 청산 충격, 비트코인 ETF 7일 연속 순유입

4월 24일 퇴근길 팟캐스트 — 리플 2.94억달러 롱 청산 충격, 비트코인 ETF 7일 연속 순유입

비트코인 급등 뒤 ‘가격 공백’ 남겼다…헤드앤숄더 완성 분기점

비트코인 급등 뒤 ‘가격 공백’ 남겼다…헤드앤숄더 완성 분기점

카르다노 ‘개발 1위’ 부상…에이다 가격은 약세 지속

카르다노 ‘개발 1위’ 부상…에이다 가격은 약세 지속

미군 부사관, ‘마두로 축출’ 내부정보로 폴리마켓 베팅…40만달러 수익 혐의

미군 부사관, ‘마두로 축출’ 내부정보로 폴리마켓 베팅…40만달러 수익 혐의

댓글

댓글

0

추천

1

스크랩

스크랩

데일리 스탬프

0

말풍선 꼬리

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1