소프트뱅크와 Ampere Computing이 CPU를 활용해 소형 인공지능(AI) 모델을 더 효율적으로 실행하기 위한 공동 프로젝트를 시작했다.
외신에 따르면 양사는 저지연·고효율 추론 환경을 구축해 차세대 인공지능 인프라의 핵심 기술로 삼는다는 계획이다. 이를 통해 GPU 의존도를 낮추면서도 소형 AI 모델 운용 비용을 줄일 수 있는지 검증할 것으로 보인다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>
뉴스
리서치
멤버십
팟캐스트
포트폴리오