딥시크가 대규모 언어모델(LLM) 학습·추론용 고성능 GPU 연산자 라이브러리 '타일커널스(TileKernels)'를 GitHub에 오픈소스로 공개했다고 PANews가 23일 보도했다.
타일커널스는 TileLang 기반 프로젝트로, 연산 성능이 하드웨어 연산 능력과 메모리 대역폭 한계에 근접하도록 최적화됐다. MoE 라우팅과 FP8·FP4 양자화, 다양한 융합 연산자를 지원하며 이미 딥시크 내부 환경에서 사용되고 있다.
이 라이브러리는 현재 엔비디아 SM90과 최신 SM100(블랙웰) 아키텍처를 지원하며, CUDA 13.1 이상이 필요하다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
많이 본 기사