분산형 AI 연구소 Gradient가 Echo-2 분산 강화학습(RL) 프레임워크를 공개했다. 이 프레임워크는 Learner와 Actor를 아키텍처 단계에서 완전히 분리해 300억(30B) 파라미터급 모델의 후훈련 비용을 4,500달러에서 425달러 수준으로 낮추고, 동일 예산에서 10배 이상 연구 처리량을 제공하는 것이 특징이다.
Echo-2는 저장과 연산을 분리한 구조를 바탕으로 비동기 강화학습(Async RL)을 구현해, 대량의 샘플링 연산을 불안정한 GPU 인스턴스와 Parallax 기반의 이기종 GPU로 분산 처리한다. 여기에 유한 지연(유한한 범위 내의 데이터 신선도 관리), 인스턴스 장애 허용 스케줄링, 자체 개발한 Lattica 통신 프로토콜 등을 적용해 모델 정확도를 유지하면서도 훈련 효율을 크게 끌어올렸다.
Gradient는 Echo-2 공개와 함께 RLaaS(강화학습 서비스형 플랫폼) ‘Logits’를 곧 선보일 예정이다. 이 플랫폼을 통해 AI 연구를 자본 집약적 구조에서 효율 중심 구조로 전환한다는 목표다. Logits는 현재 전 세계 학생과 연구자를 대상으로 사전 예약을 받고 있으며, Gradient는 대규모 모델의 분산 훈련·서비스·배포 인프라 구축에 특화된 AI 연구소로 알려져 있다.
기사점수: 1
발행: 1





