美 TACC, '호라이즌'으로 AI 슈퍼컴퓨팅 패러다임 바꾼다

| 김민준 기자

AI 가속 슈퍼컴퓨팅이 기후 모델링부터 신약 개발까지 과학 전반을 혁신하며 새로운 패러다임을 열고 있다. 특히 미국 텍사스 첨단 컴퓨팅 센터(TACC)에 설치 중인 ‘호라이즌(Horizon)’ 시스템은 이 변화의 중심에 자리 잡으며 오픈 사이언스의 새로운 기준이 될 전망이다.

텍사스 오스틴에 위치한 TACC의 슈퍼컴퓨터 책임자 존 카제스에 따르면, 호라이즌 시스템은 기존 대비 최대 10배의 성능 도약을 제공한다. 그는 "우리가 구축한 시스템 중 가장 강력하고 방대한 규모"라며, 이 발전이 미국 과학계에 제공할 수 있는 영향력을 강조했다. 호라이즌은 총 4,000개의 GPU와 4,700개 이상의 연산 노드를 갖춘 초대형 인프라로, AI와 과학 애플리케이션의 융합을 염두에 두고 설계됐다.

이 프로젝트는 단순한 하드웨어 확장에 그치지 않는다. 고성능 컴퓨팅 환경에서 수반되는 지연 시간(latency) 및 열 밀도 문제는 상당한 공학적 도전 과제였으며, 이를 해결하기 위해 DELL 테크놀로지스와 협력해 새로운 형태의 랙 설계와 냉각 방식이 도입됐다. 델의 글로벌 AI 인프라 리더 토니 레아는 "델은 고밀도 시스템을 일관되게 실행 가능한 상태로 제공할 수 있는 거의 유일한 업체"라고 자부했다.

특히 주목해야 할 점은 호라이즌이 과학자 친화적으로 설계되었다는 점이다. 상용 GPU 클러스터가 대부분 기업에 의해 독점되는 현실에서, 호라이즌은 학계에도 대규모 자원 접근 기회를 제공한다. 연구자는 이제 수천 개의 GPU를 통합된 환경에서 활용해, 유전자 분석부터 천체물리학까지 다양한 분야에서 가시적인 성과를 도출할 수 있게 된다.

이러한 접근 방식은 실제 과학 프로젝트들을 기준으로 시스템 성능을 검증하는 과정에서도 드러났다. 전통적 벤치마크 대신, 실제 연구 애플리케이션 11종을 통해 성능 향상 가능성을 입증했다는 점은 시사하는 바가 크다. 카제스는 "단순히 실행 속도만 빨라진 것이 아니라, 실제로 훨씬 더 많은 과학적 작업을 달성할 수 있다"고 강조했다.

호라이즌 프로젝트는 결국 ‘민주화된 AI 컴퓨팅’이라는 새로운 비전을 구현하고 있다. 슈퍼컴퓨팅 자원의 접근성을 연구 공동체로 확장함으로써, AI 시대의 과학 연구는 더 이상 대기업의 전유물이 아니다. 이런 변화는 오픈 사이언스의 본질적인 가치를 되살리고, 차세대 과학 인프라의 청사진을 제시하고 있다는 데서 중요한 의의를 지닌다.

호라이즌이 본격 가동되면, AI 기반 연구가 지금보다 훨씬 빠른 속도로 진화할 가능성이 커진다. 고성능 AI 인프라 구축 경쟁이 전 세계적으로 가속화되는 가운데, 미국 과학계가 이 점에서 주도권을 확보할 수 있을지 귀추가 주목된다.